顯示結果從 1 到 10 共計 3855 條

查看主題

  1. #11
    註冊日期
    2007-10-23
    文章
    942
    Thanks
    3,381
    Thanked 4,143 Times in 838 Posts

    預設

    引用 作者: arnoldonomics 查看文章
    看起來您想要測試的更像是兩個聲道的相位/時間差? 小弟覺得要在phase response相當不平順的情況下才可能有實際上的"相位問題"。

    另外早期D類擴大機的phase response雖然不太漂亮,但換算成時間差的話,好像也沒有特別糟糕... 因此小弟猜測psycho教授感受到的定位問題可能不是"相位"而是其他問題。 至少小弟現在從訊號處理或是心理聲學的定義來看,定位問題和器材的"相位"之間可能實務上沒有太大的關係。 不過這方面可能要請psycho教授整理更多關於定位問題的聽感才能判斷了

    比如說:

    正確錄音: 器材在什麼樣的情況定位正確/錯誤,錯誤時會有哪些現象~

    錯誤錄音: 同上
    arnoldonomics兄您好,

    是的,小弟正是想要測量兩聲道之間的相位/時間差。

    基本上,音場中的定位,就是由兩聲道之間的音量差和相位差來決定。
    這個部分的聲音心理學,在混音界已經研究了很長一段時間。

    人類對聲音定位的判斷,可以分成「方位/方向」和「深度/前後距離」兩種。

    關於方位/方向定位,小弟好像幾年前在哪裡有分享過.. 現在記憶力越來越糟..
    如下圖:


    大約800Hz以下,基本上就是用左右耳聽到聲音的相位差/時間差來判斷,越往低頻判斷方位的能力越差。
    800Hz~2KHz,左右耳的音量差和相位差會一起被用來判斷方位。
    所以在這個頻率範圍內,聲音來源的方位判斷力是最準確的。方位判斷解析度甚至可以高達1~2度,非常精準。
    2KHz~4KHz,人耳對這個頻率範圍的方向判斷力非常差。
    4KHz以上,只用音量大小來判斷聲音方向,相位資訊不重要。

    而深度/前後距離的定位,靠的是回音的特徵來判斷。
    回音有三個特徵可以一起用來判斷聲音來源的距離:
    1. 回音和直接音之間的時間差。
    2. 因為高頻的聲速比低頻快,所以回音反射時間越長,高頻會超前低頻越多,造成時間差/相位差。
    3. 高頻強度消散的比低頻快,所以反射距離越遠,高頻的強度就越低。
    綜合這三個資訊,大腦就可以憑經驗判斷出聲音源的距離。

    如果假設人耳的前音場定位寬度大約是60度,左右再多加15度,總共約為90度,如下圖:


    根據德波埃效應(De Poher Effect),左右聲道差15dB時,人耳會把聲音認為只從單邊喇叭出聲,完全忽略那個音量較小的喇叭。
    假設定位角度跟左右音量差異的dB值成線性關係,則每度的音量差異為15dB/45度 = 0.33dB/度。
    而從上文中可以知道,人耳從800Hz以上開始參考音量差來分辨方位,而4KHz以上完全仰賴音量差。
    所以,一個音響系統裡,至少從800Hz以上,左右聲道的音量差異越小越好。
    小弟認為除了喇叭和空間以外,其他的器材要做到這點並不困難。

    同時,德波埃效應也告訴我們,當左右喇叭的時間差為3ms的時候,人耳也會把聲音認為只從單邊喇叭出來。
    所以按照上一段的計算方式,每度方位角的時間差為3ms/45度 = 67us/度。
    人耳利用相位來判斷方位角的頻率為2KHz以下。
    而67us的時間差在2KHz時的相位差為48度,在200Hz時為4.8度,在20Hz時為0.48度。
    器材的左右聲道相位差能夠做到什麼程度,說實在的小弟沒什麼概念。
    所以才會想要量量看。

    而如上文所說,相位的正確性除了影響方位定位,也會影響深度定位。
    不過深度定位的相位正確性,除了跟左右聲道之間的相位差異有關,
    跟單一聲道特定頻率的相位穩定度也是有關的(如果是DAC的話,其實這點跟低頻率jitter息息相關)。

    ps. 人耳雖然對2KHz~4KHz之間的方位辨別率很低,但是在這個頻率範圍內,對音高的辨識率是最高的。
    在這個頻率範圍內,聲音只要14ms的長度,人耳就可以聽出正確的音高。
    超出這個頻率範圍以外,聲音的持續時間要拉長,人耳才能辨認出音高來。
    小弟覺得這也可以引申爲人類對這個頻率範圍的音色辨識率也最高。



    如果看英文無障礙,小弟推薦一本書:
    William Moylan寫的UNDERSTANDING AND CRAFTING THE MIX: THE ART OF RECORDING
    目前出到第三版,Amazon上面一本賣47美金。
    上面的圖全部來自於這本書。
    小弟有找到網路上有免費下載的第二版電子版,很值得一讀,連結如下:
    https://epdf.pub/understanding-and-c...recording.html

    引用 作者: arnoldonomics 查看文章
    小弟是這麼想的,crosstalk或許可以和center channel 有某種程度上的等價。 如果左聲道和右聲道有一部分的聲音是相同的話,那這一部分的聲音和兩聲道播放mono 錄音的效果應該是一樣的。

    而考慮 upmix 到 LCR 三聲道的玩法,center channel 通常是 左聲道 * A + 右聲道 * A (A 為一參數)。
    這時,如果存在crosstalk:
    左聲道 = 左聲道 + 右聲道 * A * 0.707
    右聲道 = 右聲道 + 左聲道 * A * 0.707

    (由於 右(左)聲道 * A * 0.707 同時存在於左右聲道,相當於中聲道有 "右(左)聲道 * A" 這個訊號。

    這樣和upmix 到 LCR 三聲道的聽感應該是類似的?

    (當然這是比較粗淺的upmix玩法,複雜一些的還會考慮EQ, 時間延遲等等的問題~
    您用的upmix玩法用的是最基本的演算法,把左右聲道不屬於中間聲道的部分,也一併加入了中間聲道。
    這樣做的話,中間聲道跟左右聲道的聲音分離度會非常的低,音場會變窄。
    不過當然,這樣就跟crosstalk是類似的意思,只是crosstalk是把左右互加,所以會更慘。

    小弟原本以為您和朋友用的upmix玩法有把左右聲道相同的成分抽出來放到中間聲道,有做L/C/R decomposition。
    這樣應該是比較好的upmix演算法,不會有音場變窄的問題。
    https://pdfs.semanticscholar.org/d0d...6665700c32.pdf
    此篇文章於 2020-06-08 03:16 PM 被 bchsieh 編輯。

  2. The Following 8 Users Say Thank You to bchsieh For This Useful Post:


發文規則

  • 不可以發表新主題
  • 不可以發表回覆
  • 不可以上傳附件
  • 不可以編輯自己的文章
  •