- 音頻編解碼器技術(shù)解剖
- 個(gè)人音頻簡(jiǎn)介
- 音頻編碼解碼器中后處理算法簡(jiǎn)介
- 房間修正簡(jiǎn)介
一些音頻編碼解碼器芯片主要由圍繞一些處理硬件的一個(gè)模數(shù)轉(zhuǎn)換器(ADC)和一個(gè)數(shù)模轉(zhuǎn)換器(DAC)組成,但它們只是眾所周知的海底冰山露出來(lái)的一角。最近一段時(shí)間,大部分工程師認(rèn)為音頻編解碼器就是在DSP平臺(tái)上運(yùn)行的壓縮和解壓縮算法。在整個(gè)音頻頻率范圍里,“語(yǔ)音”編解碼器適合數(shù)字電話應(yīng)用,而“音頻”編解碼器則適合娛樂(lè)音頻應(yīng)用。
在這個(gè)意義上,音頻編解碼器是從Dolby公司的噪音抑制技術(shù)演變成Dolby和其它一些公司更綜合性的壓縮方法。它們的出現(xiàn)還與國(guó)際標(biāo)準(zhǔn)組織(ISO)的運(yùn)動(dòng)圖像專(zhuān)家小組(MPEG)有關(guān),該工作小組負(fù)責(zé)為數(shù)字音頻和視頻的編碼表示制定相應(yīng)的標(biāo)準(zhǔn)。
盡管語(yǔ)音編解碼器技術(shù)的發(fā)展一定程度上處于靜止?fàn)顟B(tài),但音頻編解碼器技術(shù)一直在向前演進(jìn)(參見(jiàn)圖1)。例如,朝更多的環(huán)繞聲通道發(fā)展就是一個(gè)趨勢(shì)。最大的一個(gè)技術(shù)趨勢(shì)是增加了用于模擬立體聲系統(tǒng)中的多通道音頻的技術(shù),以再造特別實(shí)況音樂(lè)會(huì)會(huì)場(chǎng)的“現(xiàn)場(chǎng)感”。于是產(chǎn)生了完成所有這些處理的挑戰(zhàn),因?yàn)槟悴辉倌苡靡揽緼V接收器或DVD播放器內(nèi)的大功率電源供電的DSP引擎來(lái)實(shí)現(xiàn),而必須用靠手機(jī)或PDA中的電池供電的DSP引擎來(lái)實(shí)現(xiàn)。所有上述因素就為兩個(gè)不同但卻融合的應(yīng)用領(lǐng)域(個(gè)人音頻和家庭影院)帶來(lái)了一個(gè)有趣的故事。
個(gè)人音頻
德州儀器公司(TI)便攜音頻和信息娛樂(lè)業(yè)務(wù)部首席技術(shù)官RandyCole指出,在個(gè)人音頻領(lǐng)域最普遍的音頻編碼解碼器是MP3(參見(jiàn)圖2)。MP3一度局限于PC和便攜多媒體播放器,但它目前在手機(jī)行業(yè)中也比比皆是,其原因就是手機(jī)制造商不斷地追逐新功能,以誘使最終用戶每隔六個(gè)月就進(jìn)行一次產(chǎn)品換代。
MP3是ISO公布的一項(xiàng)標(biāo)準(zhǔn)。它是由MPEG制定的MPEG-1編碼解碼標(biāo)準(zhǔn)系列中的第三個(gè)。MPEG-1有三層,每一層都包括前面的層。因而,第3層實(shí)現(xiàn)了第1和2層。出于這個(gè)原因,MPEG-1及第3層就是眾所周知的MP3,它提供了一個(gè)適于便攜應(yīng)用的帶寬和數(shù)據(jù)速率,雖然較低卻足夠了。
在過(guò)去10年中,MP3一直是下載音樂(lè)的主導(dǎo)性音頻編碼解碼器。但是蘋(píng)果公司的iPod在一項(xiàng)名為先進(jìn)音頻編碼器(AAC)的新MPEG開(kāi)發(fā)項(xiàng)目中打破了這個(gè)慣例。MPEG在1990年代中期開(kāi)始從事AAC標(biāo)準(zhǔn)的制定,將其作為下一代MPEG-2研究的一部分,并實(shí)現(xiàn)了AT&T、Dolby、Fraunhof和索尼公司開(kāi)發(fā)的最好最新設(shè)計(jì)理念。起初,它打算同MP3后向兼容,但這個(gè)目標(biāo)不可能達(dá)到。
因此,由于整個(gè)行業(yè)深深卷入MP3,沒(méi)有一家公司愿意調(diào)撥資源為AAC這個(gè)新方案生產(chǎn)大量的音頻節(jié)目,所以它衰敗了。也就是說(shuō),直到蘋(píng)果公司為iPod選擇AAC的MPEG-4版本之前,該技術(shù)一直處于衰敗的狀態(tài)。(在MPEG-2之后成立的下一個(gè)MPEG工作小組是MPEG-4,越過(guò)了MPEG-3。蘋(píng)果公司所用的MPEG-4AAC是MPEG-2AAC的一個(gè)強(qiáng)化版本,其數(shù)據(jù)速率稍低而質(zhì)量有改進(jìn)。)
其它專(zhuān)有的編碼器存在于MP3和AAC范疇之外。它們?cè)赑C和個(gè)人多媒體設(shè)備領(lǐng)域有一定的穿透性,但它們?cè)谑謾C(jī)行業(yè)就不太重要,因?yàn)槭謾C(jī)生產(chǎn)商寧愿標(biāo)準(zhǔn)的編碼器及其固定的版稅。一種大家熟悉的專(zhuān)有編碼器是WindowsMediaAudio(WMA)。它主要用于PC,并在其中與MP3和AAC進(jìn)行競(jìng)爭(zhēng)。然而,從數(shù)據(jù)速率看,它很靈活(從低到高有適當(dāng)?shù)馁|(zhì)量差異)。目前,還有WMA的多頻道版本W(wǎng)MA-Pro,而且微軟公司在2005年6月還發(fā)布了一種損耗更低的WMA。
其它重要的專(zhuān)有編碼器就是DolbyDigital,也就是著名的AC3。這種編碼器用于DVD和(美國(guó)的)數(shù)字電視。直到最近,它的運(yùn)行速率對(duì)互聯(lián)網(wǎng)和手機(jī)來(lái)說(shuō)還是太高。不過(guò),需要補(bǔ)救的是一個(gè)把數(shù)據(jù)速率降得更低的新版本。
根據(jù)TI公司高性能音頻業(yè)務(wù)部行銷(xiāo)經(jīng)理MohsinImtiaz的觀點(diǎn),在家庭影院領(lǐng)域主要的編碼解碼器是Dolby和DTS。Dolby公司發(fā)布的DolbyDigitalPlus瞄準(zhǔn)了高清晰度DVD和廣播市場(chǎng)。但是在MP3、AAC、WMA等便攜標(biāo)準(zhǔn)之間有一定的交叉。針對(duì)下一代DVD,微軟公司正在力推WMA。
解析一個(gè)編解碼器
讓我們分解一個(gè)編解碼器。為了把整個(gè)事情說(shuō)清楚,我們看一篇在2004年10月音頻工程學(xué)會(huì)年會(huì)上提交的論文,它描述的是DolbyDigitalPlus技術(shù)。[page]
該論文說(shuō)新的DolbyDigitalPlus編碼解碼器是基于DolbyDigital的較早版本,也叫AC-3。DolbyDigitalPlus或加強(qiáng)型的AC-3(E-AC-3)保留了元數(shù)據(jù)載運(yùn)器、過(guò)濾器庫(kù)和幀結(jié)構(gòu)。目前的數(shù)據(jù)速率范圍從32Kb/s到6.144Mb/s。在采樣速率32KHz和六模塊轉(zhuǎn)換幀的條件下,數(shù)據(jù)速率控制的分辨率可達(dá)到每秒1/3位。(數(shù)據(jù)速率的分辨率正比于采樣速率,反比于幀的尺寸。)
E-AC-3保留了AC-3的六個(gè)256系數(shù)轉(zhuǎn)換幀結(jié)構(gòu),但它允許包含一個(gè)、兩個(gè)和三個(gè)256系數(shù)轉(zhuǎn)換模塊的較短幀存在。其結(jié)果就是,音頻傳輸可以在高于6?0Kb/s的速率下進(jìn)行,這適合于某些限制了每幀數(shù)據(jù)量的DVD。
E-AC-3可以支持目前的5.1、6.1或7.1頻道,進(jìn)而一直到電影院的13.1頻道。主音頻節(jié)目位流加上多達(dá)八個(gè)的附加子流經(jīng)過(guò)多路選通進(jìn)入一個(gè)單一的E-AC-3位流。通過(guò)頻道替換消除了矩陣減法引起的編碼失誤。與AC-3相比,E-AC-3能多傳輸七個(gè)獨(dú)立的位流。
編碼效率的提高還可以通過(guò)一個(gè)新的濾波器庫(kù)、更好的量化、強(qiáng)化的頻道耦合、譜擴(kuò)展和一種名為“瞬態(tài)預(yù)噪音處理”的技術(shù)來(lái)實(shí)現(xiàn)。
當(dāng)具有穩(wěn)定特征的音頻出現(xiàn)時(shí),該濾波器庫(kù)在現(xiàn)有的AC-3濾波器庫(kù)之后加入一個(gè)二級(jí)DCT。這把六個(gè)256系數(shù)轉(zhuǎn)換模塊轉(zhuǎn)換成一個(gè)單一的1536系數(shù)混合轉(zhuǎn)換模塊,且提高了頻率分辨率。這個(gè)提高的頻率分辨率與六維向量分量(VQ)及增益自適應(yīng)分量(GAQ)結(jié)合在一起可以改進(jìn)“難于編碼”信號(hào)的編碼效率,比如說(shuō)黑管和大鍵琴。
VQ用于需要較低準(zhǔn)確度的頻帶區(qū)。當(dāng)需要更高準(zhǔn)確度分量時(shí),GAQ更有效率。此外,通過(guò)頻道與相位保存的耦合可以使編碼效率得到一個(gè)提升。在AC-3用一個(gè)高頻單合成頻道作為每個(gè)頻道上高頻部分的地方,加入相位信息和編碼器控制的譜幅度處理能夠讓這個(gè)高頻單合成頻道處理較低的頻率,從而減小了有效的編碼帶寬并增大了編碼效率。
譜擴(kuò)展是用頻域上轉(zhuǎn)換的較低頻譜段代替了較高層的頻率轉(zhuǎn)換系數(shù)。該轉(zhuǎn)換頻譜段的譜特征通過(guò)轉(zhuǎn)換系數(shù)的譜調(diào)制與原始的形式匹配。
為了提高低數(shù)據(jù)速率時(shí)的音頻質(zhì)量,E-AC-3采用了瞬態(tài)預(yù)噪音處理技術(shù)。這個(gè)后解碼過(guò)程把預(yù)噪音誤差降到最低,其做法是采用可縮短預(yù)噪音持續(xù)時(shí)間的時(shí)標(biāo)合成技術(shù),因而降低了瞬態(tài)擾動(dòng)的可聽(tīng)度。由編碼器計(jì)算并在E-AC-3位流中發(fā)送的元數(shù)據(jù)提供了后解碼過(guò)程、時(shí)標(biāo)合成處理所需的參數(shù),時(shí)標(biāo)合成處理使用了聽(tīng)覺(jué)情景分析技術(shù)。
后處理
用于音頻編碼解碼器中后處理的專(zhuān)有算法與DolbyDigitalPlus這類(lèi)壓縮標(biāo)準(zhǔn)一樣重要,它們對(duì)任何受許可人也相同。在這個(gè)領(lǐng)域中,這些算法對(duì)多頻道標(biāo)準(zhǔn)攜帶的信息進(jìn)行操作,從而把家庭影院轉(zhuǎn)化成任何形式的收聽(tīng)場(chǎng)所:從一個(gè)巨大的教堂到一個(gè)爵士音樂(lè)俱樂(lè)部的戶外搖滾音樂(lè)會(huì)。
按照ADI公司SigmaDSP產(chǎn)品經(jīng)理ThomasIrrgang的說(shuō)法,后處理全都是圍繞著OEM商追求一個(gè)“簽名聲音”的愿望開(kāi)展的。大概最先做成功這點(diǎn)的是THX公司。其它開(kāi)展后處理研究的公司包括SRS、TruSurroundXT和TruBass。
在電視領(lǐng)域有能夠復(fù)原MP-3編碼損失的后處理器BBE,包括BBE3D和BBEMP。還有一種專(zhuān)門(mén)用于電視的算法BBEViva,在電視中立體聲話筒一般放置的非常近以便獲得良好的立體聲收聽(tīng)效果。
低音增強(qiáng)在便攜系統(tǒng)和電視機(jī)中正變得重要起來(lái),這些設(shè)備不會(huì)給大的話筒驅(qū)動(dòng)器留有大的空間。目前最突出的是WAVES公司的MaxxBass算法,它大概也是最流行的低音增強(qiáng)算法,因?yàn)樗鰪?qiáng)了正被處理材料中低音的主觀感受水平,同時(shí)又不加入任何低頻能量。
Dolby公司在后處理領(lǐng)域以其VirtualSpeaker(虛擬話筒)和DolbyHeadphone(Dolby耳麥)算法而聞名于世。Dolby公司表示其技術(shù)復(fù)制了多個(gè)所以聲音簽名,包括反射,同時(shí)提供了串?dāng)_抵消,以便保持每個(gè)耳朵的環(huán)繞音質(zhì)不被其它話筒的環(huán)繞音質(zhì)所抵消。虛擬話筒和Dolby耳麥算法最初是由澳大利亞的LakeDSP公司開(kāi)發(fā)的。Lake現(xiàn)在是Dolby的一家分公司。
當(dāng)然,天下沒(méi)有免費(fèi)的午餐。諸如虛擬話筒這樣的算法只能在一個(gè)相對(duì)小的室內(nèi)空間(俗稱(chēng)“甜場(chǎng)”)中模仿缺失話筒的存在。在這個(gè)“甜場(chǎng)”之外,環(huán)繞信息崩潰了。該聲音不算壞,但聽(tīng)起來(lái)它來(lái)自一個(gè)常規(guī)的雙耳話筒設(shè)置,情況就是這樣。
為了重新生成一個(gè)物理空間,Panasonic公司的網(wǎng)站上說(shuō),其HallMode(大廳模式)“再生了回響效果,使聽(tīng)眾有一種空曠之音繞著自己傳播的感覺(jué),”而且它在“享受音樂(lè)廳內(nèi)的交響樂(lè)表演時(shí)的效果尤其好。”一個(gè)雅馬哈A/V接收器的評(píng)論家認(rèn)為雅馬哈的音樂(lè)廳“的確加入了額外的一維,使人感到聲場(chǎng)的高度,‘音樂(lè)廳模式’甚至讓你忍不住要嘗試一下。對(duì)于令人喜愛(ài)的Mahler第四交響樂(lè)的立體聲錄音,‘音樂(lè)廳模式’給人一種親臨現(xiàn)場(chǎng)的感覺(jué)。”
房間修正
在后處理領(lǐng)域,超越虛擬化的下一步就是房間修正。這個(gè)功能開(kāi)始出現(xiàn)于2002年或2003年的高端多頻道系統(tǒng)中,而且目前已經(jīng)發(fā)展到處于價(jià)格/性能譜系中端的系統(tǒng)。它對(duì)一套公寓樓內(nèi)家庭影院系統(tǒng)的用戶滿意度至關(guān)重要,因?yàn)樵诩彝ビ霸合到y(tǒng)中不可能對(duì)稱(chēng)設(shè)置左、右話筒,或者說(shuō)房間內(nèi)一堵墻的聲學(xué)性能不同于它對(duì)面墻的聲學(xué)性能。多頻道系統(tǒng)從房間修正技術(shù)中獲益最多。它也許對(duì)兩頻道設(shè)置的影響較小,但立體聲系統(tǒng)一般說(shuō)來(lái)對(duì)誤調(diào)整和誤校準(zhǔn)不那么敏感。
房間修正涉及到把該系統(tǒng)調(diào)整為T(mén)EST(測(cè)試)模式,在最喜歡的傾聽(tīng)位置處放一個(gè)麥克風(fēng),并播放出一系列測(cè)試聲音以便弄清楚房間聲學(xué)性能方面的信息和話筒本身的局限性,隨后根據(jù)專(zhuān)有算法調(diào)整增益和均衡度。對(duì)于房間整定技術(shù),一個(gè)令人感興趣的交叉領(lǐng)域是汽車(chē)應(yīng)用。多年來(lái),一直在對(duì)昂貴汽車(chē)內(nèi)OEM的音響系統(tǒng)進(jìn)行聲學(xué)調(diào)整以便獲得最佳性能,但這是一個(gè)相當(dāng)費(fèi)力而且相當(dāng)主觀的人工過(guò)程。
汽車(chē)制造商已經(jīng)開(kāi)始采用自動(dòng)的聽(tīng)覺(jué)空間調(diào)整。實(shí)踐證明,除了豐富的聽(tīng)覺(jué)經(jīng)驗(yàn)外,這類(lèi)調(diào)整一個(gè)最重要的方面就是聲學(xué)上的回音抵消。這意味著消除從免手拿話筒到安裝在太陽(yáng)帽或頭頂處麥克風(fēng)的反饋。
手機(jī)和個(gè)人多媒體設(shè)備的融合
MP3和AAC數(shù)據(jù)速率對(duì)個(gè)人多媒體播放器及PC是恰當(dāng)?shù)?。但?duì)于手機(jī)來(lái)說(shuō),數(shù)據(jù)速率必須要低一些。而且顯而易見(jiàn)的是,與下載音樂(lè)文件以便稍后播放相比,通過(guò)蜂窩網(wǎng)鏈接的流音頻有著很不同的需求。
由第3代合作規(guī)劃委員會(huì)(3GPP)制訂的3G手機(jī)標(biāo)準(zhǔn)采用AAC作為音頻編碼解碼器標(biāo)準(zhǔn),可滿足了這兩類(lèi)應(yīng)用的要求。該標(biāo)準(zhǔn)最新的修改版(版本6)允許使用兩種音頻編碼解碼器中的任何一種。一種就是AAC的強(qiáng)化版,叫做AAC-Plus或高效率AAC(HE-AAC)。
前不久,強(qiáng)化AAC-Plus或高效率AAC的第二套改進(jìn)版(版本2)也添加進(jìn)來(lái)。另一種選擇是“AMRWidebandPlus”,它是一種強(qiáng)化的語(yǔ)音編碼器。對(duì)GSM手機(jī)來(lái)說(shuō),AMR寬帶是一種非常流行的語(yǔ)音編碼器。其Plus改進(jìn)版將其應(yīng)用擴(kuò)展到可處理音樂(lè)。
蘇格蘭的Wolfson微電子公司從事硬件音頻編碼解碼器的制造,該公司新產(chǎn)品開(kāi)發(fā)部的副總裁PeterFrith指出,給手機(jī)加入回放MP3的功能,或者用于下載音樂(lè),或者作為高質(zhì)量的鈴聲,意味著用戶已經(jīng)希望在手機(jī)中看到一個(gè)相對(duì)高保真的回放系統(tǒng)。因此,手機(jī)制造商目前期盼出現(xiàn)功耗甚至更低的便攜式DAC,且能夠達(dá)到100dB的信噪比。
目前,帶多媒體功能的手機(jī)只能播放MP3。下一步要做的也許是個(gè)人多媒體播放器,它們能把手機(jī)的功能和藍(lán)牙及Wi-Fi技術(shù)結(jié)合在一起。在此期間,PDA電話已經(jīng)逐步進(jìn)入領(lǐng)域,它提供了一些播放視頻或音頻文件的功能。
那是你口袋里的合唱隊(duì)嗎?
Frith還表示,在過(guò)去,設(shè)計(jì)人員提供的手機(jī)只有非常簡(jiǎn)單的鈴聲或者M(jìn)IDI鈴聲功能。有了MIDI,硬件解決方案總的來(lái)看已經(jīng)發(fā)展成一個(gè)獨(dú)立的MIDI解碼器芯片。
雅馬哈是個(gè)典型的例子,芯片對(duì)MIDI文件進(jìn)行解碼,并將解碼結(jié)果轉(zhuǎn)換成PCM音頻文件,隨后通過(guò)一個(gè)DAC把它們播放出來(lái)。這個(gè)DAC也許可以集成進(jìn)該解碼芯片之中,當(dāng)然也可以是分立的。做到這點(diǎn)的一個(gè)替代方法是把軟件MIDI解碼器植入電話處理器之中。
用戶對(duì)播放高質(zhì)量鈴聲的興趣已經(jīng)導(dǎo)致日本市場(chǎng)上的某些電話為其鈴聲選用了MP3文件。電話對(duì)它們的處理如同一個(gè)音樂(lè)設(shè)備對(duì)MP3文件的處理一樣。它們是通過(guò)高保真音頻系統(tǒng)來(lái)處理。