混響和回聲是一樣的么?

在生活中,混響和回聲其實都是指的一件事,知乎告訴我們:

通常室內的聲音比廣闊空間的聲音要更加豐滿、結實,這是因為廣闊的空間只有直達聲,聲波是直接被人耳接收而沒有經過反射,

而在室內因為相對而言是封閉空間所以除了聲源的直達聲也有經過牆壁以及其他障礙物反射而產生的反射聲被人耳接收到。

直達聲和反射聲被人耳依次聽到的過程就叫做「混響」。

直達聲和反射聲當然不是同時被人耳接收到,它倆到達人耳是有一個時間差,其實我們聽到帶有混響的聲音本身就是多個聲音的疊加,

但可能因為聽到的多個聲音時間間隔非常地短性質又接近所以覺得是同時聽到的。那若是直達聲和反射聲相差50毫秒以上會發生什麼情況?

那人就會聽到「回聲」了。 
 
*來源於//www.zhihu.com/question/20124311/answer/14058781
 
但是在語音通信領域,混響和回聲是不同的。
 
1. 混響:

混響是指房間內,牆壁等障礙物對聲波反射,使得在同一物理空間內,聲源到達人耳的路徑,除了直接傳到的直達聲外,還有經過多個反射路徑後到達人耳的反射波。

根據達到時間的早晚,稱為早期混響和晚期混響,混響時間公認的定義是:聲能密度降為原來的1/10^6時所需的時間,相當於聲壓級衰變60分貝。某頻率的混響時間是室內聲音

達到穩定狀態,聲源停止發聲後殘餘聲音在房間內反覆經吸聲材料吸收,平均聲能密度自原始值衰變到百萬分之一(聲能密度衰減60dB)所需的時間,用T60或者RT表示。混響時

間過短,聲音發乾,枯燥無味,不親切自然;混響時間過長,會使聲音混雜;合適時聲音圓潤動聽。

混響時間是聲學設計中聲能定量估算的重要評價指標。適合電影放映的混響時間一般不超過0.8秒,適合音樂廳的混響時間一般是1.5秒。
 
下面這張圖直觀地展示了混響:
 

                                           

 

混響對語音識別的影響比較大,背景噪聲和空間內聲反射產生的混響是聲學信號處理和遠場語音識別的兩大障礙。

混響消除目前主流的算法是 WPE(Weighted Prediction Error),主要用於去除信號中的混響成分,此算法基於線性預測估計,這篇帖子介紹的比較全面:

語音去混響算法之WPE( Weighted Prediction Error for speech dereverberation)  //blog.csdn.net/veritasalice/article/details/107417996

這個代碼可以參考:WPE Matlab代碼 //www.kecl.ntt.co.jp/icl/signal/wpe/index.html

 

2.回聲

通信中的回聲包括聲回聲和線回聲。

聲學回聲是指接收端揚聲器播出的聲音在接收端被聽到的同時,也通過多種路徑被接收端的麥克風拾取到,然後通過網絡傳輸回發送端,使得發送端的通話人在揚聲器中聽到了

自己的聲音。接收端多路徑反射的結果產生了不同延時的回聲,包括直接回聲和間接回聲。直接回聲是指由揚聲器播出的聲音未經任何反射直接進入麥克風。間接回聲是指由揚

聲器播出的聲音經過不同的路徑 (如房屋或房屋內的任何物體 )的一次或多次反射後進入麥克風所產生的回聲的集合。

聲回聲產生過程如下圖所示:

                                         

線回聲是指電話網絡中,二四線耦合器產生的回聲,產生過程如下圖所示:

 

                                                                

 

 

 無論聲回聲和線回聲,都可以通過自適應濾波器的方式來解決,如下圖:

 

                           

 

作為通話鏈路的重要一環,也是互聯網音頻三劍客 3A 中的AEC,有許多的方法和論文,

這篇文章介紹的比較全面:回聲消除中的自適應濾波算法綜述  //www.cnblogs.com/LXP-Never/p/11773190.html

眾所周知,谷歌的WebRTC中的語音引擎中包含了AEC模塊,這個代碼可供參考://github.com/ewan-xu/AEC3

 

有意思的是,在很多場景下,需要增加混響來使得聲音更加的真實。而回聲消除也被廣泛地用於智能音箱在播放音樂時的語音控制。