Chap01. 聲音與人耳聽覺
生理聽覺
人耳的結構分為外耳、中耳和內耳,如下圖:
- 外耳的耳廓首先會對到來的聲音進行一定程度的反射,這些細微的變化能夠輔助人即使在利用單耳時識別聲音的方向(耳廓效應)
- 由於鼓膜的阻擋,耳道是一個封閉的管子,這種結構具有管共振效應,最佳共振頻率約為3.4kHz,這部分的聲音由於共振被加強,導致人耳對此敏感
- 鼓膜被聲波驅動,從而驅動與其連線的聽小骨,聽小骨由三塊骨頭鏈狀銜接組成,分別是錘骨、砧骨和鐙骨
- 錘骨附著在鼓膜上,鐙骨則附著在耳蝸的卵圓窗上,耳膜驅動錘骨,錘骨驅動砧骨,然後是鐙骨,最終到達卵圓窗。
- 耳蝸由蝸管捲曲起來形成蝸牛狀,是一個換能器,負責將接收到的震動轉化為生物電訊號傳遞給
- 耳蝸中充滿液體,震動使得液體產生波紋
- 波紋推動毛細胞術運動,從而產生電訊號
- 耳蝸底部的毛細胞能夠檢測高音調的聲音,而頂部則用於檢測低音調的聲音
推薦影片:精妙到不可思議!2分鐘科普:人是如何聽到聲音的?
耳蝸不同區域對音調的感知:
心理聽覺
- 音高雖與頻率相關,但強度也會引起音高感知變化
- 響度雖與強度相關,但與頻率也相關
- 音色雖與頻譜相關,但瞬態特性也會產生影響
思考題
本人的想法,不一定準確
-
人耳可聽頻率範圍是多少,頻率與音高有什麼樣的關係
20Hz到20kHz,基頻越高我們聽到的音高越高
-
聲壓與聲壓級的關係如何?聲壓增加一倍,聲壓級提高几分貝?
聲壓是聲音震動對空氣的擾動程度,是在本來的大氣壓下疊加上去的壓強。聲壓級是聲壓與參考聲壓級的比值取常用對數再乘以20,用於以更小的數字表示聲壓大小。後面一個問題不會算。
-
樂音與噪音從物理屬性上的區別是什麼
樂音的振動有明顯的基波,可以識別音高,噪音的震動雜亂無章,無明顯基波,無法識別音高
-
粉紅噪聲的名稱由來是什麼?與白噪聲有何區別?
-
根據人耳的構造,說明為什麼人耳對3kHz到4kHz的聲音最敏感
外耳道和鼓膜形成了一段封閉的管,人耳普遍的形狀導致該管的最佳共振頻率是3.4kHz左右,所以3k到4k的聲音得到了加強
Chap02. 音高感知與頻譜均衡
Chap05. 空間感知與聲場建立
方位座標圖
聲源方位可以由下圖座標系\((\phi, \theta, r)\)表示,\(\phi\)是聲源對於聽音者的垂直方位角,\(\theta\)是水平方位角。
\(\phi\)確定水平面,\(\theta\)確定中垂面,當\(\phi = 0, \theta=0\)時,聲源位於聽音者正前方。
方向定位
當\(\phi\)固定,即在水平面上,\(\theta\)移動時
- 人對正前方的方向解析度最高(1到3度)
- 隨著向側方移動,方向辨別閾(人耳察覺方位變化的最小角度,越小越好)逐漸增加,正左側和正右側最大,約為正前方的3到10倍
- 隨著移動到後方,辨別閾逐漸減小,約為正前方的2倍
說明聲音在水平面的不同方位人耳的感知靈敏度是不同的,正前方最靈敏,左右側最不靈敏,後側稍微靈敏一些也比不過正前方
自由場(理想聲學環境,聲波自由傳播,不受任何反射、吸收或散射的影響)下,對單一聲音方向定位因素包括:
-
雙耳效應:由雙耳訊號差異產生的定位效應,時間差、聲壓級差,主要用於水平方向定位
- 雙耳時間差(ITD):當聲音位於中垂面時,ITD=0,當位於正側方時,ITD最大,約為0.6到0.7ms。研究結果表明頻率\(f>=1.5kHz\)時ITD不再起主要作用
- 雙耳聲級差(ILD):頻率\(1.5kHz<f<4kHz\)時,ITD和ILD同時起作用,\(f>4kHz\),ILD為有效定位因素
-
耳廓效應:當聲源處於垂直方向不同位置時,由於聲音到達位置不同,經耳廓不同程度的反射後,反射聲和直達聲之間的強度比、在不同頻率上的時間差以及相位差會在鼓膜處形成一種與聲源方向位置有關的頻譜特性。導致我們識別出聲音的垂直位置
下圖為聲源位於中垂面,仰角分別為-10、0以及10度時在人頭模型上測得的耳廓響應曲線,響應變化主要集中在高頻
-
人頭轉動
距離定位
-
響度(自由場):距離增加一倍聲壓級下降6dB
-
直達聲和混響聲的聲能比:混響半徑\(r_r\)是指直達聲和混響聲聲能相等的位置,當聲源距離\(r<r_r\)時,直達聲為主,響度起主要作用,當\(r>r_r\)時,混響聲為主,總聲壓級幾乎恆定,響度不再起作用,直達聲與混響聲的聲能比\(D/R\)為估測距離的有效因素
-
空氣對聲波的吸收所引起的高頻衰減:聲源非常遠時起作用,普通房間尺寸忽略
感知聲源寬度(ASW)
- 早期反射聲是影響ASW的重要因素,取決於早期反射聲的寬度和延時時間
- 人們偏愛更寬闊的ASW
- IACC_e越小,ASW越寬
- 側向聲能比LF越高,ASW越寬