名偵探柯南中的變聲器:工作原理竟如此簡單
名偵探柯南是眾多人心中崇拜的偶像,沒有案子能難倒柯南。
不過,柯南辦案離不開高科技「武器」,其中最讓人夢寐以求的一種「武器」就是蝴蝶結變聲器,因為它隨心所欲地克隆任何人的聲音。
其實,在現實世界中,這樣的變聲器並不少見。網上搜索「變聲器」,便跳出各種軟體,「帥哥變蘿莉,大媽變御姐」,任君選擇。
百度變聲器搜索頁面
在某些領域,變聲技術也成了企業業務中的重要支撐。比如高德地圖裡林志玲、周星馳的導航聲音,就得到了很多人的支援。
那「變聲」是怎麼實現的呢?
「變聲」變的是什麼?
首先,我們先得了解聲音具有哪些性質。判斷兩個聲音是否相同,我們一般從音調,響度,音色三個方面進行比較。
音調強調聲音的高低,響度反應聲音能傳播的距離,音色是一聲音特有波形的外在表現,結合這3個因素,就能分辨出不同的聲音。
圖片來源:《名偵探柯南》
要想實現「變聲」,就要從這三個因素下手。通常來講,變聲器藉助對音色和音調的雙重複合改變,實現對聲音的改變。
變聲器之所以能變聲是因為建立了一套獨特的演算法,能識別聲音的音色和音調並對其進行調整,讓聲音產生變化。
變聲器app截圖,可選擇不同的聲音進行變聲圖片來源於網路
變聲器類型
目前市場上的變聲器主要有兩大類,一類是硬體變聲器,一類是軟體變聲器。雖然表現形式不一,但是變聲原理相似。
硬體變聲器是通過各種音效卡(也就是硬體音效卡)變聲,音效卡里預置了各種設置好演算法的聲音,藉此實現「變聲」。但這種方式缺點很明顯,那就是電流聲明顯且種類相對較少。
相比之下,軟體變聲器使用更方便,能滿足各種變聲需求(比如唱歌,播音主持等),使聲音更加立體,音效也更為豐富。
怎麼實現變聲
那這些不同的變聲器到底是怎麼改變聲音特質的呢?
01 聲波取樣和時域分析
人發聲的本質是通過聲帶震動,帶動空氣產生氣壓差,從而讓聲波在空氣中傳播。變聲器要在一定範圍內採集量化這些聲音,通常取樣在44100Hz,量化的範圍在16bit,)也就是說,在一秒內可取樣44100個樣本點來描繪波形。
這些波形裡面有各種不同的小波形,學術上叫做「基波」,每個人的基波不一樣,都有自己的基音周期,也就是「基音頻率」,即個體所擁有的獨特的音頻/音質/音色/音調,從而建立起各種各樣聲音的「資料庫」。
圖片來源:科學探索中心
02 傅里葉轉換
對聲音進行了取樣和量化,接下來就是傅里葉轉換,只有轉換成頻譜圖,然後通過各種演算法去捕捉規律,對聲音訊號以及不同聲音頻率的識別和分析,從而達到變聲。
傅里葉轉換小科普:傅里葉轉換是由傅里葉數學家所發明,要想完整的從數學角度了解傅里葉轉換必須具有高等數學的基礎,不過從通俗易懂的角度去理解,傅里葉轉換就是指將一件事情從兩個維度去分析,比如一首歌,不同的時間段有不同的音調,但是從另一方面分析,可以把每個時間段的音調轉換成數字,從而精準定位不同時間段的不同「調調」。
03 賦予音色風格
變聲器不僅要能識別音頻和語言內容,還要能賦予音色不同風格(比如語速快慢、強弱),只有這樣,變聲才稱得上是隨心所欲。