音訊檔案格式

音頻文件格式專指存放音頻數據的文件的格式。存在多種不同的格式。

一些音頻文件圖標

一般獲取音頻數據的方法是:採用固定的時間間隔,對音頻電壓採樣(量化),並將結果以某種分辨率(例如:CDDA每個採樣為16比特或2字節)存儲。採樣的時間間隔可以有不同的標準,如CDDA採用每秒44100次;DVD採用每秒48000或96000次。因此,採樣率分辨率聲道數目(例如立體聲為2聲道)是音頻文件格式的關鍵參數。

需要分清楚的是音頻文件和編解碼器不同。儘管一種音頻文件格式可以支持多種編碼,例如AVI文件格式,但多數的音頻文件僅支持一種音頻編碼。

有兩類主要的音頻文件格式:

有損文件格式是基於聲學心理學的模型,除去人類很難或根本聽不到的聲音,例如:一個音量很高的聲音後面緊跟着一個音量很低的聲音。MP3就屬於這一類文件。

無損的音頻格式(例如FLAC)壓縮比大約是2:1,解壓時不會產生數據/質量上的損失,解壓產生的數據與未壓縮的數據完全相同。如需要保證音樂的原始質量,應當選擇無損音頻編解碼器。例如,用免費的FLAC無損音頻編解碼器你可以在一張DVD-R碟上存儲相當於20張CD的音樂。

有損壓縮應用很多,但在專業領域使用不多。有損壓縮具有很大的壓縮比,提供相對不錯的聲音質量。

歷史

音頻CD格式於1980年由飛利浦公司索尼公司開發,並於1982年公布,此後很少改動。這種格式定義一首歌存放在一個CDDA文件中,輸入採樣率為44100次/秒(即44.1kHz),每個採樣用16比特數據存儲。立體聲數據為1.4M比特/秒。

作為比較,MP3格式壓縮比可以為1:12(同樣是44.1k赫茲採樣率,MP3: 112k比特/秒,CDDA:1.4 M比特/秒)。MP3格式開發始於1987年在德國Fraunhofer IIS,歷時4年,其間經歷了算法的改進和音質提高。但是由於硬盤的價格較高,這項技術當時應用很少。

1996年,Winamp1.0版的發布成為MP3格式流行的催化劑。Fraunhofer開始向採用他們的算法的公司索要許可證費用,因此其他替代的免費算法開始被研發。LAME發布於1998年,並於此後成為主要的MP3編碼器。最近以來,其它的MP3格式的挑戰者包括高級音頻編碼或者叫AAC(用於蘋果公司的iTunes)、Ogg Vorbis(一個無專利自由編解碼器)、Opus(是開放格式,標準定義於IETF RFC 6716,有更低的延遲和更好的聲音壓縮率)。

非壓縮的數據格式

目前存在多種非壓縮數據格式,最流行的是WAV格式。WAV文件的格式靈活,可以儲存多種類型的音頻數據。對於保存原始的錄音數據是一個好的選擇。WAV格式是基於RIFF文件格式,RIFF格式與AIFFIFF格式類似。

BWF(廣播聲波格式)作為WAV的後繼者,是由歐洲廣播聯盟創建的一種標準音頻格式。BWF文件中可以存放元數據。BWF文件也是也是基於RIFF文件格式的,擴展名是WAV。有關其信息參見:歐洲廣播聯盟:Specification of the Broadcast Wave Format - A format for audio data files in broadcasting(廣播聲波格式描述-一種廣播用音頻文件格式)。歐洲廣播聯盟技術文檔3285, 七月1997年。

無損壓縮的數據格式

  • APE頁面存檔備份,存於網際網路檔案館) 龐大的WAV音頻文件可以通過Monkey's Audio這個軟件進行壓縮為APE格式。被壓縮後的APE文件容量要比WAV源文件小一半多。[來源請求]通過Monkey's Audio解壓縮還原以後得到的WAV文件可以做到與壓縮前的源文件完全一致。
  • FLAC頁面存檔備份,存於網際網路檔案館) 格式的源碼完全開放,而且兼容幾乎所有的操作系統平台。它的編碼算法已經通過了嚴格的測試,而且在文件點損壞的情況下依然能夠正常播放。該格式不僅有成熟的Windows製作程序,還得到了眾多第三方軟件的支持。此外該格式是唯一的已經得到硬件支持的無損格式[來源請求],Rio公司的硬盤隨身聽Karma,建伍的車載音響MusicKeg以及PhatBox公司的數碼播放機都能支持FLAC格式。
  • Apple Lossless頁面存檔備份,存於網際網路檔案館) 為蘋果的無損音頻壓縮編碼格式,可將非壓縮音頻格式(WAV、AIFF)壓縮至原先容量的40%至60%左右,編解碼速度很快。
  • WavPack頁面存檔備份,存於網際網路檔案館) 允許用戶壓縮、取消復原8、16、24、32位元整型以及32位元浮點表示的WAV格式音訊檔案,另外它還支援多聲道資料流以及非常高的取樣頻率。另外WavPack引入了一種獨特的「混合」模式,它使用一個附加的檔案從而也具有了失真壓縮的優點。

有損壓縮的數據格式

  • MP3,為ISO/IEC國際標準,是現在最普及的一種數位音訊編碼和有損壓縮格式,幾乎所有的終端和軟件都支援此格式。
  • AAC,為ISO/IEC國際標準,是MP3的下一代格式,壓縮比MP3更高音質更好的音訊壓縮演算法,因此得到了眾多公司的支持。
  • VorbisXiph.Org基金會開發,自由軟件和沒有專利的編解碼器;能夠完整保留20kHz下音質細節,採用可變比特率(VBR),動態調整比特率達到最佳的編碼效果。
  • OpusXiph.Org基金會開發,IETF標準的開放格式,是Vorbis下一代格式,用單一格式包含聲音和語音,具有低延遲特性,適用於網路上的即時聲音傳輸。

多聲道格式

從九十年代起,影院開始將音響系統升級為環繞聲系統,它可容納2個以上的聲道。環繞聲系統中最流行的是杜比數字(Dolby Digital)系統(或稱AC-3)和 數位影院系統(Digital Theater Systems,DTS)。這兩種編解碼器都是受版權保護的,其編碼器和解碼器須支付許可證費用才能獲得。最流行的多通道格式叫做5.1,意思是5個環繞聲道(左前、前中、右前、左後和右後)和一個低重音聲道(因為人的耳朵無法區分低頻率聲音傳來的方向)。

參見

參考文獻

外部連結