arnoldonomics兄您好,
是的,小弟正是想要測量兩聲道之間的相位/時間差。
基本上,音場中的定位,就是由兩聲道之間的音量差和相位差來決定。
這個部分的聲音心理學,在混音界已經研究了很長一段時間。
人類對聲音定位的判斷,可以分成「方位/方向」和「深度/前後距離」兩種。
關於方位/方向定位,小弟好像幾年前在哪裡有分享過.. 現在記憶力越來越糟..
如下圖:
大約800Hz以下,基本上就是用左右耳聽到聲音的相位差/時間差來判斷,越往低頻判斷方位的能力越差。
800Hz~2KHz,左右耳的音量差和相位差會一起被用來判斷方位。
所以在這個頻率範圍內,聲音來源的方位判斷力是最準確的。方位判斷解析度甚至可以高達1~2度,非常精準。
2KHz~4KHz,人耳對這個頻率範圍的方向判斷力非常差。
4KHz以上,只用音量大小來判斷聲音方向,相位資訊不重要。
而深度/前後距離的定位,靠的是回音的特徵來判斷。
回音有三個特徵可以一起用來判斷聲音來源的距離:
1. 回音和直接音之間的時間差。
2. 因為高頻的聲速比低頻快,所以回音反射時間越長,高頻會超前低頻越多,造成時間差/相位差。
3. 高頻強度消散的比低頻快,所以反射距離越遠,高頻的強度就越低。
綜合這三個資訊,大腦就可以憑經驗判斷出聲音源的距離。
如果假設人耳的前音場定位寬度大約是60度,左右再多加15度,總共約為90度,如下圖:
根據德波埃效應(De Poher Effect),左右聲道差15dB時,人耳會把聲音認為只從單邊喇叭出聲,完全忽略那個音量較小的喇叭。
假設定位角度跟左右音量差異的dB值成線性關係,則每度的音量差異為15dB/45度 = 0.33dB/度。
而從上文中可以知道,人耳從800Hz以上開始參考音量差來分辨方位,而4KHz以上完全仰賴音量差。
所以,一個音響系統裡,至少從800Hz以上,左右聲道的音量差異越小越好。
小弟認為除了喇叭和空間以外,其他的器材要做到這點並不困難。
同時,德波埃效應也告訴我們,當左右喇叭的時間差為3ms的時候,人耳也會把聲音認為只從單邊喇叭出來。
所以按照上一段的計算方式,每度方位角的時間差為3ms/45度 = 67us/度。
人耳利用相位來判斷方位角的頻率為2KHz以下。
而67us的時間差在2KHz時的相位差為48度,在200Hz時為4.8度,在20Hz時為0.48度。
器材的左右聲道相位差能夠做到什麼程度,說實在的小弟沒什麼概念。
所以才會想要量量看。
而如上文所說,相位的正確性除了影響方位定位,也會影響深度定位。
不過深度定位的相位正確性,除了跟左右聲道之間的相位差異有關,
跟單一聲道特定頻率的相位穩定度也是有關的(如果是DAC的話,其實這點跟低頻率jitter息息相關)。
ps. 人耳雖然對2KHz~4KHz之間的方位辨別率很低,但是在這個頻率範圍內,對音高的辨識率是最高的。
在這個頻率範圍內,聲音只要14ms的長度,人耳就可以聽出正確的音高。
超出這個頻率範圍以外,聲音的持續時間要拉長,人耳才能辨認出音高來。
小弟覺得這也可以引申爲人類對這個頻率範圍的音色辨識率也最高。
如果看英文無障礙,小弟推薦一本書:
William Moylan寫的UNDERSTANDING AND CRAFTING THE MIX: THE ART OF RECORDING
目前出到第三版,Amazon上面一本賣47美金。
上面的圖全部來自於這本書。
小弟有找到網路上有免費下載的第二版電子版,很值得一讀,連結如下:
https://epdf.pub/understanding-and-c...recording.html
您用的upmix玩法用的是最基本的演算法,把左右聲道不屬於中間聲道的部分,也一併加入了中間聲道。
這樣做的話,中間聲道跟左右聲道的聲音分離度會非常的低,音場會變窄。
不過當然,這樣就跟crosstalk是類似的意思,只是crosstalk是把左右互加,所以會更慘。
小弟原本以為您和朋友用的upmix玩法有把左右聲道相同的成分抽出來放到中間聲道,有做L/C/R decomposition。
這樣應該是比較好的upmix演算法,不會有音場變窄的問題。
https://pdfs.semanticscholar.org/d0d...6665700c32.pdf











回覆時引用此篇文章