網友 LukeLo 的「漫談數位音樂」



前言

  這一篇文章是由網友 LukeLo 所撰寫,預計發表在台大物理系系刊-時空上,我們有幸率先享用這一篇可說是本站開站以來最精彩豐富的文章,實在是非常的榮幸。以下是 LukeLo 的原文:

2002/01/01 補充:網友 LukeLo 將自己的文章精益求精,把文字修飾的更精簡了。

本文

  自電腦發明以後,資訊的數位化是不可阻擋的潮流,也是二十世紀人類文明的重大革命,影響所及,深入現代生活各個層面,反映在音樂方面最常見的產物就是CD。自音樂CD在九零年代成為主流音樂儲存媒體,數位音樂已與你我生活密不可分。本篇文章希望以深入淺出的方式,帶領讀者探索數位音樂的各類儲存格式與訊號處理技巧。


何謂數位化?

  從字面上來說,數位化(Digital)就是以數字來描述事物。例如用數字紀錄一張桌子的長寬高尺寸以及各木料間的角度,這就是一種數位化。跟數位常常一起被提到的字是類比(Analog/Analogue)。類比的意思是用相似的東西去表達,例如將桌子用傳統相機將三視圖拍下來,就是一種類比的紀錄方式。

音樂如何數位化?

  將音樂數位化,首先必須將音訊數位化。將音訊數位化的方式有很多,最常見的方式是透過PCM(Pulse Code Modulation)。音樂CD即是紀錄此種格式的數位訊號,轉換原理如下。首先我們考慮聲音經過麥克風,轉換成一連串電壓變化的訊號,如圖一所示,我們現在開始將這聲音波型的類比訊號數位化(Analog to Digital)。這張圖的橫坐標為秒,縱坐標為電壓大小。要將這樣的訊號轉為PAM(Pulse Amplitude Modulation)格式的方法,是先以等時距分割橫坐標。假設用每0.01秒分割,則得到圖二。

  接著我們把分割線與訊號圖形交叉處的座標位置紀錄下來,就完成了PAM。我們把橫坐標數字紀錄下來,得到如下資料,(0.01,11.65)、(0.02,14.00)、(0.03,16.00)、(0.04,17.74)…..(0.18,15.94)、(0.19,17.7)、(0.20,20)。現在我們已經把這個波形以數字紀錄下來了,也就是完成了來源訊號的PCM。由於我們已經知道時間間隔是固定的0.01秒,因此我們只要把縱座標紀錄下來就可以了,得到的結果就是11.65 14.00 16.00 17.74 19.00 19.89 20.34 20.07 19.44 18.59 17.47 16.31 15.23 14.43 13.89 13.71 14.49 15.94 17.70 20.00這一數列。這一串數字就是將以上訊號數位化的結果。看,我們確實用數字紀錄了事物。在以上的範例中,我們的取樣頻率是100Hz(1/0.01秒)。其實電腦中的.WAV檔的內容就是類似這個樣子,檔頭紀錄了取樣頻率和可容許最大紀錄振幅等資訊,內容就是一連串表示振幅大小的數字,有正有負。前面提到音樂CD是以PCM格式紀錄,而它的取樣頻率(Sample Rate)是44100Hz,振幅紀錄精度是16Bits,也就是說振幅最小可達-32768(-2^16/2),最大可達+32767(2^16/2-1)。在這裡我們可以發現無論使用多麼高的紀錄精度,紀錄的數字跟實際的訊號大小總是有誤差,因此數位化無法完全紀錄原始訊號。我們稱這個數位化造成失真稱為量化失真。

  以上是PCM理論上的運作方式,但是實際上我們的電路沒有辦法紀錄瞬間的振幅大小,而是紀錄取樣時距內的振幅最大值,也就是Sample/Hold的運作方式。這樣的運作方式會造成波型的偏移,且很難用事後的運算來補償,為PCM的一大缺點。

為什麼要數位化?

  數位化的最大好處是方便資料傳輸與保存,使資料不易失真。只要紀錄資料的數字大小不改變,紀錄的資料內容就不會改變。傳統類比的方式紀錄訊號,如使用LP表面的凹凸起伏或是錄音帶表面的磁場強度來表達振幅大小,在我們複製資料時,無論電路設計多麼嚴謹,總是無法避免雜訊的介入。這些雜訊會變成複製後資料的一部份,造成失真,且複製越多次訊噪比(訊號大小與雜訊大小的比值)會越來越低,有意義的資料細節也越來越少。如果讀者曾經複製過錄音帶或是錄影帶,一定有過發現拷貝版雜訊較大的經驗。在數位化的世界裡,數字轉換為二進位,以電壓的高低判讀1與0,並可加上各種檢查碼,使得出錯機率大大降低,因此在一般的情況下無論資料複製多少次,都可以達到不失真的目標。

  或許讀者會問,既然CD是數位化的儲存媒體,為什麼用燒錄機複製的燒片放到CD Player中音質往往比原版片來得差呢?數位化的複製不是不會失真嗎?這個問題我們留到後面再解答。

  那麼,數位化的資料如何轉換回原來的音樂訊號呢?這時候我們需要一項裝置叫做DAC(Digital to Analog Converter),中文叫數類轉換器。DAC的功能如其名是把數位訊號轉換回類比訊號,在我們的CD Player,音效卡中都有這裝置,而在許多電路中也經常被用到,例如顯示卡的RAMDAC。我們可以把CD Player中以PCM運作的DAC想像成16個小電阻,各個電阻值是以二的倍數增大。當DAC接受到來自CD讀取機構的二進位PCM訊號,遇到0時相對應的電阻就接上電路,遇到1相對應的電阻不作用,如此每一批16Bits數位訊號都可以轉換回相對應的電壓大小。這些電壓大小看起來會像階梯一樣一格一格,跟原來平滑的訊號差異,因此再輸出前還要通過一個低通濾波器,將高次諧波濾除,這樣聲音就會變得比較平滑。在Hi-Fi音響術語中,我們將讀取CD且輸出類比音訊的器材叫做CD唱盤,單純讀出CD資料輸出數位訊號的器材叫做CD轉盤。我們可以把CD唱盤當作CD轉盤+DAC。在Hi-End音響的領域大部分傾向將CD讀取分成轉盤+DAC。值得一提的是,雖然CD轉盤和DAC間傳遞的是純粹的數位訊號,但是我們往往可以發現更換之間的線材(常用規格S/PDIF為阻抗75歐姆的同軸電纜或是Toslink塑膠光纖),卻可以影響音質,這部分的問題我們也留到後面再說明,而這裡有相關實驗結果(http://forums.dearhoney.idv.tw/viewtopic.php?forum=1&topic=18877&start=70)。

細說音樂CD(Compact Disc Digital Audio)

  關於音樂CD實在是有太多可以聊了,這個於1982年由Sony和Philips共同制定於紅皮書的儲存媒體,便於攜帶音質又比錄音帶好,流行至今毫無頹勢。關於它的規格有許多有趣的故事,例如為什麼一片標準長度的CD是74分鐘呢?話說這是因為設計者想要把貝多芬第九號交響曲存進一片CD中,於是開始估計CD的直徑,另一套說法是著名指揮家卡拉揚(Herbert von Karajan)這樣要求,也有人說是Sony公司當時主席的太太這樣要求,另一套說法是Sony當時的Mr. Oga所決定的。另外要補充的是Herbert von Karajan指揮的貝多芬第九號交響曲總長度大概在68分鐘左右,一般的版本大概在65~74分中間分布。

  根據網友nightmare告知,大賀典雄的傳記記載當卡拉揚還活著時,跟大賀的交情匪淺(算亦師亦友的感情吧),因此當年Philips找上Sony制定CD規格時,大賀就一口咬定一片CD一定要能裝得下貝多芬第九號交響曲(大賀本身是聲樂家),因為古典音樂單首曲目的長度比這個長的也寥寥無幾,為了在聆賞時不影響興致,所以大賀對此非常堅持,而日後大賀用此錄卡拉揚預演的曲目,並讓卡拉揚聽,而卡拉揚非常讚賞這個劃時代的數位媒體,甚至後來在說明會之類的活動時,卡拉揚也幫 CD 說了不少好話。

  CD是以螺旋狀由內到外儲存資料,在一片標準74分鐘的CD中,從裡繞到外總共有22188圈,把它全部伸展開來長達5.7km。音樂的CD讀取方式是等線速度(CLV),每秒有1.2m長的資料經過雷射頭,雷射在真空中波長為780nm,以偵測CD表面的凹凸變化判讀訊號。表面的凹凸刻痕寬0.5um,深度為0.11um(約為780nm雷射在CD塑膠材質內波長的1/4),長度為0.8到3.1um。CD是以由凹變凸和由凸變凹定義為1,平坦的部分為0,所以改變刻痕的長度可以改變資料內容。而讀取頭就是靠著凹變凸和由凸變凹時的光干涉作用來判讀訊號。

  音樂CD的規格為什麼是44.1kHz、16Bits呢?關於44.1kHz這個數字的選取分為兩個層面。首先我們知道人耳的聆聽範圍是20Hz到20kHz,根據Nyquist Functions,理論上我們只要用40kHz以上的取樣率就可以完整紀錄20kHz以下的訊號。那麼為什麼要用44.1kHz這個數字呢?那是因為在CD發明前硬碟還很貴,所以主要數位音訊儲存媒體是錄影帶,用黑白來記錄0與1。而當時的錄影帶格式為每秒30張,而一張圖又可以分為490條線,每一條線又可以儲存三個取樣訊號,因此每秒有30*490*3=44100個取樣點,而為了研發的方便,CD也繼承了這個規格,這就是44.1kHz的由來。

  一張刮痕累累的CD放到CD Player中聽起來聲音常沒有什麼問題,這又是什麼原因呢?這是一個非常複雜的問題,我們必須從CD的訊號儲存格式說起。首先要引入的名詞是block,CD每秒鐘的資料被分成7350個block。每個block內有588bits的資料。可是這588bits無法全部用來儲存有意義的資料,因為過度密集的凹凸變化會造成硬體設計難度的增加,且CD是以由凹變凸和由凸變凹定義為1,無法重複出現1,因此每14個bits中只有8個bits是有意義的,這就是所謂EFM(Eight-to-Fourteen-Modulation)的目的。扣除6bits無意義的資料,每個block剩下588*8/14=336bits,再扣除同步(sync)與合併(merge)資訊,剩下264bits,等於264/8=33bytes。在這33個data bytes中,有1個sub-code byte、12個odd-audio bytes、4個Q-redundancy bytes、12個even-audio bytes和4個P-redundancy bytes。其中最有意義的就是那12+12=24個音訊bytes,每個block共有24*8=192bits,由於CD以16bits紀錄資料大小,因此每個block有6個立體聲取樣點資料(6*16*2=192)。還記得前面說過每秒鐘有7350個block嗎?由此可以得知每秒鐘有6*7350=44100個立體聲取樣點!沒錯,就是這個數字。順帶一提的是每98個block組成一個frame,每秒有75個frame(98*75=7350)。好了,我們還沒講到重點,為什麼有輕微刮痕的CD聽起來還是很正常呢?

  答案就在於這24bits的音訊資料,並非單純按照出現順序儲存在單一的block中,而是打散順序離散分布在接下來109個block中,因此若有刮痕造成一部份的資料無法正確讀出,可以藉由前面提到的P-redundancy bytes和Q-redundancy bytes作同位檢查確保資料正確性,進而重建資料,還可利用聲音連續變化的特性,由問題資料的前後取樣點來內插補點。實際編碼時,是先將12bytes的even samples重新排列然後經由C2編碼計算出4 bytes的Q-redundancy得到28bytes的資料,然後由這28bytes的資料來決定這24bytes的音訊要如何分布在0到108個block中。再來將這28Bytes的資料經過C1編碼,如此就得到4bytes的P-redundancy。P-redundancy另外的用途是確保當取樣點都為0時這block中的32bits仍不都為零。另外每個block還有一個sub-code byte,其用途非常廣泛,在lead-in的區域sub-code紀錄了這張CD有幾軌、總長度多少﹔在音軌的部分則記錄了從這軌開頭已經經歷了多少時間、從第一軌開頭又經歷了多少時間、這音軌是二聲道還是四聲道(不過從來沒聽說過四聲道的CD)、是否允許複製、以及該音軌是否有經過Pre-emphasis處理與一些偵錯資訊。另外sub-code也可以用來記錄該CD的UPC(Universal Product Code)碼與該音軌的ISRC(International Standard Recording Code)碼。ISRC由IFPI統一發放,前兩碼英文代表國名,再來三碼英文為發行者,最後五碼是數字。

  我們常在古典音樂CD上看到DDD,ADD,AAD字樣,又代表了什麼意思呢?這三個英文其實是Digital或Analog的縮寫,第一個英文表示錄音時的母帶為數位或是類比格式,第二的英文代表混音及剪輯時母帶使用數位或是類比格式,最後一個英文字代表最終的Master母帶是用數位還是類比格式儲存,由於音樂CD的母帶一定是數位化的,因此最後一個英文字都是D。

  接下來想要介紹一些CD的衍生物如HDCD,xrcd2等,但是不可避免要提到一些數位錄音著專業術語,因此我們先解釋一下這些術語。

數位音訊處理名詞解釋

Pre-emphasis

  Pre-emphasis就是在錄音的時候將高頻訊號放大,放音時再把訊號用同樣的倍率縮小以還原波形(De-emphasis),在類比錄音的時代,這個技巧的主要用途是作為提高訊噪比。例如廣播發送時將頻率1500Hz to 2000Hz以上以每八度音6dB的倍率提高訊號,或是LP唱片(LP)在錄製時的RIAA(美國唱片工業協會)等化曲線(不過這曲線的制定目的主要與LP的結構有關,且放大訊號不只高頻而已),以及錄音帶用的杜比抑噪系統,都是使用同樣的原理。在數位的領域,Pre-emphasis的主要用意在於降低量化失真,因為一般的音樂訊號高頻段往往振幅比較小,而且越高的頻率振幅越小,所以從PCM取樣的原理中我們可以發現這些小振幅會被分配到較少數的bits來記錄,這樣有效描述振幅的數字就變小了,與原波型的誤差就變大了,因此我們使用Pre-emphasis的技巧先增加高頻振幅再取樣來降低高頻量化失真。使用這功能的音樂CD非常少見,推測是因為Pre-emphasis和De-emphasis這一來一回的計算,反而造成了更大的失真。就筆者所知風之谷原聲帶就有經過Pre-Emphasis處理,由之前提到的subcode紀錄著這項資訊。

Supersampling(Oversampling)

  Supersampling字面上的翻譯叫做超取樣,原理是從已有的數位訊號經過內插補點計算得到取樣點間的訊號振幅資訊,例如把44.1kHz轉成176.4kHz的四倍超取樣。超取樣並不能幫我們把更多的細節從量化失真中找回來,它的主要用意是幫助我們獲得更正確的類比訊號。怎麼說是更正確的呢?從之前關於PCM取樣的介紹我們知道越高頻的訊號被取樣的次數就會越少,想像一個20kHz的正弦波經過44.1kHz的取樣,一個週期分不到三個取樣點,要從這三個取樣點算出原來的正弦波理論上是可以辦到的,但實作的這樣的數位電路來計算是非常繁雜的,因此發展出來了各種取巧的方式希望能藉由較簡單的計算得到接近原波型的結果,超取樣算是其中的一種方法,用意是為了重建高頻訊號與原始波型。

Dynamic range

  中文叫做動態範圍,也就是容許紀錄資料最大值與最小值的比值,例如16Bits紀錄精度的音樂CD其動態範圍最大就是20*log[(2^16)/1]=96.3dB。用越多bit紀錄,我們就可以得到越大的動態範圍。如果能紀錄越大的動態範圍,我們就能紀錄越多的細節,並且更能保存爆炸聲等大音量聲音的波形。當動態範圍不足時,為了不造成破音,我們只好降低錄音音量,可是小範圍的聲音變化可以分配的bit就減少了,造成量化失真更為嚴重。

Peak Level

  我們把一段波型的最大振幅叫做Peak,peak level則是這最大振幅與最大可容許紀錄振幅的比值。在16bits的例子中,最大振幅就是32767,20bits的例子中就是524287。在之前PCM取樣原理的介紹中我們可以發現越大的振幅可以分配到越多的bit去紀錄,因此同樣的一段波型只要Peak Level不超過1(超過可能會爆音),則原始類比訊號音量越大紀錄的波型越精準。

Normalize

  Normalize就是將一段波型音量放大,放大的目標是讓原波型的最大振幅(peak)等於最大可容許振幅。我們常常會抱怨自做精選集CD這一首音量好大,下一首音量又太小,這時將每首都經過Normalize處理可以改善這個問題。不過由於經放大過後的振幅大小可能不是整數,最後不可避免要用到四捨五入之類的技巧,因此處理過的波型和原波型造成非線性放大產生誤差,再度導致量化失真。所以為了保留音色與相位的正確性,處理數位音樂盡量避免Normalize,除非放到後剛好不須捨棄位數。

Dither

  Dither是數位音樂處理上非常神奇的技巧,目的是用少數的bits達到與較多bits同樣的聽覺效果,方法是在最後一個bit(LSB:Least Significant Bit)動手腳。例如用16bits紀錄聽起來好似20bits的資料,聽到原先16Bits無法紀錄的微小資訊。舉例來說,今天我有個20Bits的取樣資料,我現在想把存成16Bits的資料格式,最簡單的轉換方式就是直接把後面四個bits直接去掉,但是這樣就失去用20Bits錄音/混音的意義。比較技巧性的方法是在第17~20Bits中加入一些噪音,這段噪音就叫做dither。這些噪音加入後,可能會進位而改變第16個Bit的資料,然後我們再把最後四個bits刪掉,這個過程我們稱為redithering,用意是讓後面四個bits的資料線性地反映在第16個bit上。由於人耳具有輕易將噪音與樂音分離的能力,所以雖然我們加入了噪音,實際上我們卻聽到了更多音樂的細節。

  關於dither有種比喻是說我們透過手指間的細縫只能看到眼前部分的圖形,但是如果前後揮動手掌,就可以透過不同時刻看到的各個圖形的一小部份,在腦中建構出完整的圖形資訊,這是大腦神奇的地方,不是簡單的理論就可以說得通的。在此我提供一個網址,該網頁內提供經過dither處理和原始的wav檔下載,內容是一個固定頻率的聲音以等比例逐漸降低音量,我們可以發現經過dither處理過的聲音聽起來失真比較少且持續比較久,也就是可以讓我們聽到更小的音量與細節,還附有dither前後的波型圖示,網址如下:http://www.mtsu.edu/~dsmitche/rim420/reading/rim420_Dither.html。在眾多的dither技術中,Sony公司的SBM(Super Bit Mapping),LIVE STUDIO RECORDINGS的ULTRA MATRIX PROCESSING,都是專攻20bits轉16bits的技術。Dither在數位音訊處理用途非常廣泛,舉凡兩個波型的相加、振幅的縮放、Normalize都會用到。現在的錄音室已經進展到24bits錄音,在CD還是主流儲存媒體的時代,dither還是非常重要的技術。順道一提,在影像處理領域,將24bits的全彩圖形以16bits的高彩畫面顯示也會用到dither的技術。

Jitter

  Jitter一般翻譯作時基誤差,是數位音訊播放音質劣化的原因之一。Jitter會造成聲音的改變,成因並非振幅資料本身的錯誤,而是時間部分出錯了。在之前數位化的過程中我們知道一個取樣點包括振幅和時間這兩項資料,而jitter造成振幅沒有在準確的時間呈現出來使得波型扭曲。在普通的CD Player中,由於讀取機構是由資料流量來判斷轉速是否合宜,而電路的工作時脈又是以讀出的一連串數位訊號的多少來決定,因此當轉速不穩定時,每秒讀出的資料數量就有誤差,而電路工作時脈就受到影響,由電路工作時間所決定的各個取樣點的出現時間與實際的時間就產生誤差,這就是jitter的成因之一。還有很多影響工作時脈的因素可能造成jitter,例如CD的重量與厚度是否均勻影響轉動穩定性、反射面的材質、石英震盪的品質、CD轉盤到DAC之間的連接線,都會造成jitter。要避免jitter發生最直接的方法就是re-clock,將接收的數位訊號先存到緩衝記憶體中,在精準的時鐘運作下重新送出這些數位訊號,並且讓後續的數位電路以這個時鐘為運作基準。有些Hi-End器材使用不同於一般S/PDIF的單線數位傳輸介面,加入包含時鐘訊號的接線用意即在此。S/PDIF將運作時脈資訊藏在資料的變化中,因此資料流量會影響運作時脈。

  或許讀者仍對所謂資料正確但是音質受到影響感到疑惑,為了讓讀者對jitter有更深刻的認識在此提出一個相關實驗。準備一張音樂CD,然後複製成另外一張,並用抓音軌軟體檢查確保這兩張CD的資料內容是相同的,可是放到CD Player中聆聽卻發現兩張CD的音質有很大差異。原先猜測是因為CD Player的讀取機制不如電腦光碟機精準,但經過專業用音效卡CardDeluxe數位錄音從CD Player的數位輸出(SPDIF Out)的結果,經過多次的比對我們發現數位錄音的結果與直接抓音軌的資料內容相同,也就是說CD Player讀取資料內容並沒有問題,而影響音質的主要原因是jitter。單位時間資料流量不穩定的變動造成jitter,但這些資料內容本身並沒有出錯,因此不能單從數位錄音的資料發現錯誤。一般來講,除非設計上有瑕疵,jitter不該會大到使資料內容出錯,否則該稱為Error而非jitter。

音樂CD的衍生物與接替產品

HDCD(High Definition Compatible Digital)

  別給這個產品名稱給嚇到了,HDCD本質上還是CD,放到一般的CD Player中播放完全沒有問題。HDCD是Pacific Microsonics創始人Keith Johnson和Pflash Pflaumer於1995年提出的規格,其技術本身也包含從20Bits的原始母帶dither至16Bits的技術,但其獨特的地方在於比dither更有效利用CD的第16個Bits(LSB),它不但用dither技術處理LSB,使得音質比一般CD好,甚至將LSB以固定的數字排列,當作是一種指令,這種指令在一般的CD Player對於聽覺沒有影響,可是在搭載HDCD解碼晶片的CD Player上,這些特殊的指令就可以改變聲音的特性,例如增加某頻段的音量,提昇整體動態範圍,或是音場調整。這些加料的功能使得聲音聽起來細節更多,定位更加精準,這正是HDCD的特色。常見的CD如孫燕姿的幾張專輯都經過HDCD處理過。HDCD的技術並非限於音樂CD,在DVD-Audio上也有發揮的空間。目前HDCD的技術屬於Microsoft,Windows XP內建的Media Player就有辨識HDCD的功能。

xrcd(extended resolution compact disc)

  Xrcd也是不折不扣的音樂CD,由JVC製作發展。Xrcd的特色是以DIGITAL K2處理。這套技術不光是以20bits 128倍超取樣將類比訊號轉為數位訊號,還加上另一套20Bits轉16bits的dither技巧,意圖將CD製作過程的每一個步驟最佳化!不但非常注重各個器材的供電品質,器材的連接線材,配送系統,且為了降低jitter對音質的影響,所有的數位訊號都改用SDIF-2傳輸,有別於一般所使用的AES/EBU工業標準,並對於時鐘的運作精度做過特別的校正。經處理最後的CD母帶資料儲存於Sony PCM9000 MO,送至位於日本橫濱全世界唯一一條xrcd生產線。Xrcd另外一個特色是以鋁作為反射面(與一般CD相同),JVC宣稱是因為使用鋁可以達到比較低的jitter。Xrcd價位相當高,通常要一千三百元以上,便宜的如麥田之歌也要八百多元,但是音質與音場表現的確有其獨到之處,因此在發燒音響界仍有其市場。

DVD-Audio

  DVD-Audio是以DVD(Digital Versatile Disc)作為儲存媒介的新音樂媒體,於1999年三月提出。取樣方式為LPCM(Linear Pulse Code Modulation),可選擇性採用MLP(Meridian Lossless Packing)無失真壓縮技術減少龐大的資料容量。DVD-Audio的取樣率有44.1kHz、48kHz、88.2kHz、96kHz、176.4kHz、192kHz等,可以16Bits、20Bits、24Bits取樣,使用立體聲錄製時最大資料流量可達192kHz 24Bits,當採用5.1聲道(家庭劇院用中置一顆揚聲器、主聲道兩顆、後環繞兩顆、超低音一顆合稱5.1聲道)錄製時最大取樣率可達96kHz。DVD-Audio可於播放時搭配畫面與音樂輸出。DVD-Audio如此高的取樣率最大的好處在於不需要繁複的超取樣運算就可以得到正確的音訊波型,另一個好處是減少jitter對音質的影響。DVD-Audio目前的價位大概在一千兩百元左右。

SACD(Super Audio Compact Disc)

  SACD是Sony所提出以DVD為儲存媒體的下一代音樂儲存規格。SACD的最大特色在於摒棄PCM來數位化,改用Delta-Sigma Modulation(屬於PWM(Pulse Width Modulation)的一種)。其實Delta-Sigma Modulation是很常見的技術,平價的CD Player,床頭音響,CD隨身聽,音效卡,都是先將PCM訊號先經過Delta-Sigma Modulation然後再轉為類比訊號。Delta-Sigma Modulation之因為可以用較低的成本和比較少的數位濾波器達到較高品質的聲音水準,因此大受歡迎,Philips的bitstream也屬此類技術。Sony將其改良的Delta-Sigma Modulation技術命名為DSD(Direct Stream Digital)。PWM不同於PCM取樣以訊號振幅大小為主,而是改為紀錄目前資料數值大於或是小於前一個資料,是相當複雜的技術,我們簡略地以下圖表示:


(上圖取自SONY的SACD廣告文件)

  SACD使用DSD的最大好處是從錄音到播放全部都以Delta-Sigma Modulation處理數位訊號,不用在錄音時先用PWM取樣再轉回PCM儲存,放音時又要把PCM經過PWM處理再經轉回類比訊號的層層手續(聽起來很笨,可是絕大部分的CD都是這樣運作的),因此可以降低失真,以下是運作圖示:


(上圖取自SONY的SACD廣告文件)

  SACD同樣也有立體聲和5.1聲道的規格。由於SACD並非PCM編碼,不需要多bits儲存振幅,只要一個bit就夠了,且取樣率使用高達2822400Hz。SACD如同DVD-Audio有單面單層和單面雙層的規格,比較特殊的是混合光碟(Hybrid Disc),此種格式第一層資料與普通CD相同,可以放到CD Player中播放,第二層則是存放正統DSD訊號,供SACD Player播放。Delta-Sigma Modulation是相當專業的技術,想要進一步認識請參考以下文件,內容取自高傳真233期 P.63,作者為黃克強先生。http://freehomepage.taconet.com.tw/This/is/taconet/top_hosts/Hotech/article4.doc

dts CD

  dts CD其資料格式與一般CD相同,都是16bits,44.1kHz,可是紀錄的資料內容並非PCM取樣訊號,而是經過dts(Digital Theater Systems)編碼後的5.1聲道訊號。Dts CD聆賞時必須將CD轉盤的數位輸出接至支援dts的解碼器才能獲得5.1聲道類比訊號。由於dts CD格式與普通CD相同,因此與HDCD、xrcd一樣都可以用普通的方法複製。

音樂CD複製技術

  音樂CD的複製,終極目標是音質與來源CD相同,甚至更好。要達到這個目的要分為兩個層面討論,首先是資料的正確性,再來是降低jitter。

  音樂CD的主要偵錯機制在於C1/C2編碼和subcode,雖然沒有CD-ROM的ECC/EDC編碼嚴謹,但輕微的刮傷還是能重建完整的資料。在複製音樂CD時,最好先將音軌資料抓到硬碟裡,然後再從硬碟燒錄。直接對燒的壞處在於當光碟機發現音軌有問題時,沒有充裕的時間可以多讀幾次確定資料內容,因此很容易燒出爆音,且刮痕太嚴重時,過多無法讀出的資料甚至會造成燒錄中斷。

  抓音軌(DAE:Digital Audio Extraction)時光碟機的品質與抓取模式對資料的正確性影響甚大。有些光碟機抓音軌的速度很慢,也有些光碟機抓得很快卻爆音連連。當光碟機抓取的資料量超過本身cache負荷時,光碟機必須暫停讀取,等cache有空間了才能繼續。有些光碟機在經歷這暫停再讀取的過程,再次讀取的位置會跟停止前的位置不同,造成資料的斷層,也就是爆音的出現,這就是抓音軌不宜一味求快的主因。要有優良的抓音軌能力,光碟機必須要具備Accurate Stream的功能,這樣就能避免以上緩衝區滿載重讀出錯的問題,更進階的是C2錯誤資訊擷取功能,也就是當光碟機在抓音軌時會同時偵測C2編碼,如果出錯的話自動重新讀取,對於資料的正確性與速度有顯著幫助。綜合以上要求,TEAC和Plextor出品的CDROM是相當優良的音軌抓取裝置,尤其是Plextor的產品,DAE速度特別出眾。另外在抓音軌時很多人喜歡用Burst Mode求其速度快,但是這種讀取方式只讀一次不回頭,如果片子很乾淨的話不會出什麼問題,要是有刮痕的話常會爆音連連,何況當遇到刮痕時光碟機常常要降低轉速,讀過去了又加速,反覆加速減速嚴重影響光碟機壽命,因此實在不建議使用Burst Mode對付有括痕的片子。

  除此之外,我們可以發現將燒好的片子中的音軌抓出來跟來自母片的音軌做比較,來自燒片的wav檔音樂資料前面總是多了一些為0的取樣點,可是檔案總長度卻沒有改變。我們稱這種情形叫做資料排序的offset。這些0的來源有兩個,來自抓音軌光碟機的Read Offset和燒錄機的Write Offset。之所以會有Read Offset是因為光碟機讀寫頭認為自己所在的位置跟實際上資料出現的位置有誤差,因此當音軌抓出來的時候,總是與原始資料產生位移,於檔案開頭多個幾個0或是少了幾個0(以上是以假設這片CD每一軌之間都是靜音來討論),而在這些0之後的資料又跟原始波型完全相同。同理燒錄機的Write Offset成因也是一樣。這些Offset並不會影響音質,只是資料和來源有些微的差異,但音樂資訊是相同的。目前能夠克服offset的抓音軌軟體和燒錄軟體非常少見,個人推薦使用免費軟體Exact Audio Copy(網頁http://www.exactaudiocopy.de/),不但可以單獨設定各光碟機與燒錄機的offset,又有獨特的Secure Mode DAE將每個frame至少重複讀取兩次,如果資料不同會重複讀取到最多82次來確定資料內容。EAC可以做出無論用什麼軟體抓音軌內容都與來源片完全一樣的燒片,是目前尋求燒錄音樂CD資料正確性的最佳解決方案。

  接下來要解決的是jitter的問題。影響的jitter層面很廣,舉凡燒錄的速度,空片的材質,燒錄機的電源等都會影響。筆者參考日本的燒片測試網站http://www.ne.jp/asahi/fa/efu/media/media.html後發現以水藍片的jitter較小,金片最大,而不同的燒錄機各有jitter最低的燒錄倍速。為了降低jitter我們建議購買日製That’s水藍片或是新加坡/日本製三菱湛藍片並且調整燒錄速度,而且避免開啟Just-Link或是Burn-Proof以免造成資料斷層。很可惜的是雖然經過這一連串的努力,燒錄出來的片子跟原版CD還是有所差異,所以為了尊重著作權與音質表現,請大家支持原版CD。不過台灣很多盜版音樂CD的jitter很大造成音質跟原版片有顯著差異,我們發現用以上的方法燒出來的片子聲音還比較好。這也告訴我們jitter是可以在事後處理加以改善的。

  另外要補充的是有些燒錄軟體和DAE軟體上會有Jitter Correction的選項,但是我們從上面的文章可以知道jitter其實不會影響資料的正確性,也就是說jitter大小並不會改變抓出來的的音軌資料內容。這些軟體所謂的Jitter Correction其實是指光碟機會藉由反覆讀取比對資料來確保資料內容的正確性,主要是用來對付有刮痕或壓製有問題的CD。這個Jitter Correction的處理層面跟上述數位音樂的jitter不同,個人建議改稱為Error Correction。

  講了半天都在講CD,數位音樂並不只包含CD,接下來就來介紹其他的數位音樂格式,就從我們常看的VCD和前一陣子震驚全台住宿大學生的話題格式MP3開始吧。

MPEG與MP3的壓縮方式

  MP3是當前最流行的音訊壓縮格式,全名為MPEG Audio Layer 3,為MPEG(Moving Pictures Expert Group)這個團體當初和影像壓縮格式同時研發的音訊壓縮格式。舉凡一般VCD影像壓縮所使用的MPEG1,音訊所使用的MP2編碼,以及DVD-Video影像壓縮所使用的MPEG2編碼都是這個團體的研發產物。這些影像和音訊的編碼都是失真(破壞性)壓縮。相較於CD和DVD的容量,未壓縮的影像和音訊資料容量是非常龐大的。想像一片音樂CD本來只可以儲存74分鐘的聲音(其實超過74分鐘的音樂CD也很多,甚至有超過80分鐘的),在VCD中不但要儲存差不多長度的音效還要加入畫面,可見壓縮率必須相當高,而且必然是破壞性的。DVD-Video的聲音格式常用的有LPCM,Dolby Digital,dts,其中LPCM通常是16Bits,48kHz立體聲訊號,與Dolby Digital同屬與DVD標準音訊規格。Dolby Digital如同MP2,MP3也是一種破壞性壓縮編碼,特色為聲道數從立體聲到5.1聲道(最新的是7.1聲道的Dolby Surround EX)都有,壓縮流量最大可達448kbps(kilo bits per second),將這個數字除以三對喇叭的的資料,我們可以算出每對喇叭(前置或後置)可以分到的流量約為149.3kbps,與時下流行的128kbps MP3大不了多少,且壓縮效率又比MP3差,因此其實大家不用對DVD-Video的Dolby Digital聲音品質存有太大的遐想,其實流量只比普通的MP3大一點點而已,何況448kbps只是最大流量,很多DVD-Video根本沒有用到這麼大的流量。

  DVD-Video的dts與音軌前面提到的dts CD使用同樣的編碼技術,最大流量與立體聲LPCM相同,也就是每秒48000*16*2=1536000bps=1536kbps,遠比Dolby Digital所提供的448kbps來得大,破壞性壓縮失真較少,因此可以想見dts DVD的音質一定比Dolby Digital來得好,這也就是為什麼市面上經過dts編碼的DVD總是賣得比較貴,身價高人一等的原因。一般支援dts的DVD-Video為了在不支援dts的設備上也可以播放所以通常會同時搭載經過Dolby Surround編碼的二聲道的Dolby Digital音訊。

  到此還沒說明為什麼MP3壓縮比例為何那麼高。音樂CD的流量是每秒44100*16*2 =1411200bps =1411.2kbps,而我們常用的MP3流量只有128kbps,壓縮後的容量小於原先的十分之一,而聽起來聲音卻還不錯。MP3壓縮時運用到五個重要的技巧,分別是最小聽覺門檻判定(The minimal audition threshold),遮蔽效應(The Masking effect),位元儲存槽(The reservoir of bytes),The Joint Stereo,和Huffman編碼

  最小聽覺門檻判定是一種減少資料量的手段,因為人耳對不同頻率的聲音聽到的音量反應不是平直的,因此我們可以將大部分的紀錄資訊集中在人耳最靈敏的2kHz到5kHz,其餘頻率分配比較少的容量紀錄。

  遮蔽效應也是聽覺心理學模型(Psychoacoustic models)的一種,在視覺上呈現的效果是在大太陽下比較難看到天空中飛翔的鳥,聽覺上的涵義就是當有一個音量或音色特別突出的聲音出現,其他細小的聲音會比較難被察覺,就像是管絃樂團齊奏時不易發現觀眾的咳嗽聲,儘管咳嗽的音量與沒有其他聲音時其實是相同的。因此在編碼時我們不需要把所有的聲音細節都編進去,而該把資料拿去紀錄比較突出容易引起注意的聲音。

  位元儲存槽在解釋前要先說明MP3的流量屬性,CBR和VBR。CBR是Constant Bitrate的縮寫,也就是說該MP3每秒鐘的資料流量是固定的,常見的MP3都是以CBR編碼,好處是壓縮速度快。相對的VBR是Variable Bitrate的縮寫,每秒鐘的流量是可以變化的,好處是在訊號複雜時用比較多的容量去紀錄,波型簡單時就用比較低的流量,以有效利用空間。CBR的缺點就是每秒鐘的流量都相同,很容易造成空間的浪費,因此有reservoir of bytes的出現,用途是當波型簡單時不要用那麼大的流量,把多餘的空間保留下來儲存將來比較複雜的波性資料,維持流量的大小,達到類似VBR的效果。VBR的MP3並不需要reservoir of bytes。

  Joint Stereo是一種立體聲編碼技巧,主要分為Intensity Stereo(IS)和Mid/Side (M/S) stereo兩種。IS的是在比較低流量時使用,利用了人耳對於高頻訊號向位分辨能力的不足,將音訊資料中的低頻分解出來合成單聲道資料,剩餘的高頻資料則合成另一個單聲道資料,並另外紀錄高頻資料的位置資訊,來重建立體聲的效果。例如鋼琴獨奏的錄音就可以利用這種方法在有限的資料流量中減少音場資訊但大幅增加音色資訊。

  Mid/Side (M/S) stereo在左右聲道資料相似度大時常被用到,紀錄方式是將左右聲道音訊合併(L+R)得到新的一軌,再將左右聲道音訊相減(L-R)得到另外一軌,然後再將這兩軌資料用上面提到聽覺心理學模型與濾波器處理。Mid/Side (M/S) stereo與IS一樣的是利用部分相位(phase)資訊的損失來換得較高的音色紀錄資訊。一般的MP3是Mid/Side stereo和Intensity Stereo交替使用的,視資料內容與流量而定。如果是更高流量如160kbps以上的MP3,則可以單獨將立體聲的兩個聲道獨立編碼,以保存相位資訊。

  Huffman編碼(coding)是一種常見的無失真壓縮方案。當PCM訊號被分成好幾個頻段並經過以上的處理之後,最後經過MDCT(Modified Discrete Cosine Transform)(類似FFT(Fast Fourier Transforms)),將波型轉換為一連串的系數。這些系數最後經過Huffman編碼來做最後的壓縮。Huffman編碼的原理是將比較常出現的字串用特定的符號表示,壓縮後就得到一個紀錄每個符號代表的字串的編碼表以及一連串由各符號組成的資料內容。Huffman編碼可以節省約20%的空間,而也因為經過了Huffman編碼,我們可以發現用WinZip、WinRAR之類的壓縮軟體並沒有辦法把MP3檔縮小多少,理由就是因為這些壓縮軟體也是利用類似Huffman編碼的技巧,因此壓縮程度有限。以上關於MP3編碼的資料取自http://www.mp3-tech.org/tech.html

  MP3播放時的運算遠比編碼時簡單,只要先經過Huffman解碼再由MDTC的逆運算重建波型就可以了,值得注意的是MP3不同於PCM沒有振幅紀錄精度(bits)的概念,我們可以自由使用16bits或是20bits甚至24bits的運算精度來重建波型。一般的MP3 Player運算精度都是16bits,而Winamp的MP3解碼外掛MAD(作者網頁http://www.mars.org/home/rob/proj/mpeg/mad-plugin/)則是以24bits處理,如果使用的音效卡支援24bits格式的PCM,就可以直接輸出24bits的訊號。一般的娛樂用音效卡都只有16bits數類轉換能力,因此訊號送給音效卡前必須要先經過re-dithering的過程,我們從之前的介紹可以知道經過這樣的處理可以聽到比16bits更多的聲音資訊與動態範圍,因此MAD在一般的音效卡上仍有其使用價值。筆者使用MAD與Winamp 2.74內建的MP3 decoder比較,發現MAD音質的確比較好,聲音開闊,小提琴擦弦感與鋼琴力度都比內建decoder好很多,強烈建議各位聽MP3時搭配使用。

  網路上有相當多的MP3壓縮軟體,有的強調速度快,有的強調使用介面間單易用。我個人是以音質作為第一考量,趁此幾會再次向各位推薦一個免費的MP3壓縮程式LAME(下載位置http://www.jthz.com/~lame/),這套程式屬於自由軟體,遵照GPL規範,為網路上很多熱心人士所集體研發而成,目前仍持續更新中,原始網頁為http://www.mp3dev.org/mp3/。截稿之前本軟體已經有3.90beta版。搭配LAME的前導程式是RazorLame,有關於此程式的使用說明與壓縮參數介紹請參考:http://www.dearhoney.idv.tw/MP3/Encoder/Tiberius20001119/。比MP3進步的壓縮格式還有mp3Pro和AAC,請參考以下網頁介紹。

http://www.dearhoney.idv.tw/MP3/mp3PRO/
http://forums.dearhoney.idv.tw/viewtopic.php?forum=3&topic=19810

  從前Internet頻寬還不大時,MP3的交流比較少見,一般網頁通常使用MIDI作為背景音樂。MIDI也是數位音樂的一大分支,以下就來介紹MIDI。

MIDI(Musical Instrument Digital Interface)

  MIDI是在1982年由世界上各電子樂器大廠所共同制定的一種電子樂器通訊介面,藉由傳送各軌發音所要的音色類型、各個音符的強弱、高低、長短、以及使用效果器的種類與參數,來記錄音樂資訊。電腦中應用MIDI格式儲存一首曲子的各音符資料的檔案種類很多,例如.mid,.midi,.wrk,.rcp….等,這些檔案由於只儲存音符的資料,而沒有關於音色波型的紀錄資料,因此容量比起wav、MP3都相當小,大部分經過WinZip壓縮後都只有十幾kbytes。

  要播放這些MIDI檔案,除了MIDI檔和播放軟體外,最重要的是MIDI音色和對應的效果器支援。我們可以把MIDI檔視作為樂譜,播放軟體視為樂團的成員,MIDI音源視為樂器,三者缺一不可。一般來講,要達到譜曲者所想表達的音響效果,最好是拿譜曲時所用的音源來播放最忠於原味,因此,MIDI的音色容量未必越大越真實越好,效果器功能也不是越誇張越好,能夠符合原作者要求而恰如其分才是最適合的。如果很不幸地無法獲得相對應的音源,至少要使用該音源廠牌同等級產品來播放,才能達到類似的效果。

  MIDI音源一般來講可以分成三種,第一種是硬體音源,例如音源器(Sound Moduler)音源卡,MIDI鍵盤,還有音源子卡。其中音源器和琴以及許多衍生配備,必須要搭配MIDI介面卡(如從前常見的Roland MPU-IPC-T)才能與電腦相連接,達到發收MIDI訊號的功能。許許多多的MIDI檔都是由譜曲者用MIDI鍵盤彈出音符,再經由MIDI Cable把訊號傳至MIDI介面卡由電腦紀錄下來。音源器是外接設備,面板上通常有音量調整與選擇各軌效果器的按鈕與液晶顯示幕,而音源卡則是將音源器的發聲構造做在電腦介面卡上,屬於內接設備。音源子卡在使用上必須另外搭配音效卡提供電源和MIDI訊號,並且放大音源子卡輸出的類比訊號。音源子卡在1994年以後開始流行,是電腦音效卡的龍頭老大Creative所提出的標準。當時有很多音效卡支援音源子卡,例如Creative SB16SB AWE32,近代的瑞麗聲之鑽,和氏璧,春之頌ProDiamond MX300Turtle-Beach SantaCruzLabway Xwave Thunder 3D等。這裡有一些音源子卡與音效卡連接的照片http://www.dearhoney.idv.tw/SoundCard/FM801/dvd6.htm,注意看這些音效卡上26pin的針腳就是用來連接音源子卡。還有一些卡不是音效卡卻可以搭配音源子卡。例如Roland MPU-401AT本身是MIDI介面卡,KORG NS5R是音源器。在眾多的音源子卡中,最有名的分別是日本三大MIDI音源廠的產品Roland SCD-15YAMAHA DB50XGKorg Topwave。關於以上天花亂墜的器材長相請參考Dearhoney數位音樂工作室博物館,看過這些器材的照片後對於以上文字會有比較清晰的概念。

  另一種MIDI音源是軟體音源,常見的軟體音源例如YAMAHA S-YXG系列,是以音源器YAMAHA MU-15(架構與音源子卡DB50XG和音源卡SW60XG類似)這台音源器為模擬對象,相容於GM,XG與GS﹔Roland VSC系列,是以Roland SC-88Pro作為模擬對象,相容於GS,GM和GM2﹔WinGroove則是由作者中山裕基先生自多台硬體MIDI音源中採樣音色,相容於GM與部分GS。軟體音源的缺點是需要較高的CPU使用率且很難做到即時發音。想像一下當按下琴鍵後過了0.3秒聲音才發出來是個多麼令人難過的事情。GigaSampler也屬於軟體音源的一種,有公開的音色檔格式,在專業領域很受歡迎。

  還有一種MIDI音源就是目前娛樂用音效卡所廣泛採用的技術-將MIDI音色存在硬碟中,當使用時再存到主機板上的RAM內,而不同於傳統上將音色資料燒死在音效卡上的ROM中。這種觀念的始作俑者是Gravis UltraSound,問世當時風靡MOD界(簡單來說MOD是一種包含音色波型的MIDI檔),但該音效卡是將音色存在卡上的RAM中,與現在的音效卡將音色存在主機板上的DRAM中還是有所不同,但目的都是避免將音色燒在卡上的ROM中以降低成本和提高使用彈性。目前市面上娛樂用音效卡的發聲晶片中,以Ymf724/744/754的內建音色與效果器支援度最廣,所用的音色與功能和S-YXG100相當類似,支援GM,XG與GS,對於這三種格式製成的MIDI檔有一定的相容性。SB Live!(發聲晶片為EMU10K1)屬於另外一種典型,它具有強大的樂器音色替換功能,並具備分頻取樣能力,可以讓使用者隨心所欲製造各種音色。很可惜地是SB Live!只支援GM,且還不吃GM Reset指令,因此播放GS/XG規格的MIDI檔,很難達到忠於原味的效果。其餘大部分的市面上的娛樂用音效卡MIDI音色都很貧弱,與其使用這些音色,不如直接去安裝上述軟體音源。

  順道一提,MS Windows98/Me和2000/XP都有內建軟體音源,只要安裝音效卡的WDM版驅動程式即可使用。其音色來源是Roland,只支援GM,不過品質相當差勁,聽過之後實在很難讓人相信是出自Roland的音色。

  GM,GS,XG這三種常見的MIDI音源規格,以GM最為廣泛。GM(General MIDI)是第一個以以音源標準化生產為目的共通統一規格。在GM尚未制定以前,各種MIDI器材之間通訊雖然都遵照MIDI標準,但是每台機器對同樣的訊號反應可能都不同,在這台音源器上的第一號樂器是鋼琴,跑到另一台音源器上可能變成了長笛,這樣子就算有了MIDI檔,流通性還是大受限制。為了解決這混亂的局面,在各廠商的協議下,1991年10月由位於美國的IMA(International MIDI Association)以及在日本的JMSC (Japanese MIDI Standard Committee),共同協議採用GM規格,作為音源的共通統一規格。GM音源規範了128個樂器以及鼓組的排列順序與同時發音數至少要達到24,還有Reverb和Chorus這兩個效果器的功能。

  在GM尚未制定之前,已經有不少遊戲使用MIDI作為配樂標準,當時Sierra公司率先使用音源器Roland MT-32作為發音音源。當時一台音源器就要比一台個人電腦還要貴了,因此能擁有MT-32最為遊戲音源的使用者都是真正的玩家。在GM制定之後,Windows 95上市以前,也有很多DOS下的遊戲都是使用GM音源作為MIDI標準。不過雖然是說支援GM,各大遊戲廠商仍普遍使用Roland SC-55作為譜曲音源器。當時配樂水準特出的Lucasarts X-Wing、TIE Fighter,Blizzard的魔獸爭霸II,Ganix美少女夢工廠II、Westwood的凱蘭迪亞傳說-命運之手等,搭配Roland SC-55真可謂餘音繞樑三日不絕與耳。

  關於Roland制定的MIDI標準GS可視為GM的擴充。其實當GM制定前Roland SC-55已經上市了,GM的128個音色正是SC-55的前128個音色,而發音數,效果器也是量身訂做,因此當GM制定後出廠的SC-55上都被打上GM字樣,這也是為什麼遊戲廠商紛紛以SC-55作為GM配樂標準的原因。XG是Roland的死對頭YAMAHA後來提出的規格,同樣相容於GM,且YAMAHA支援XG的音源普遍具備TG300B Mode,其實這就是GS Mode,只是YAMAHA打死不願意在自己的器材打上GS字樣。而GM2是1999年提出的GM擴充標準,有著256個音色與更多的效果器。雖然看到Roland就會想到GS,想到YAMAHA就會提到XG,但這些格式都是死的,並沒有制定音色資料,因此真正的播放效果還是要看各音源的支援度與規格,並非支援某特定規格的音源聽起來就一定是怎樣怎樣,還是要以該音源器的規格與發聲機制為主。

  MIDI在日本最為風行,很多業餘的玩家常常把電玩音樂用耳朵把旋律抓出來再譜成MIDI檔,這個過程叫做耳copy。一些熱門的遊戲,常常同一個曲子就有幾十種不同版本的MIDI檔,展現各編曲家的創意與技巧。我曾經在Roland的首頁看到每年舉辦一次的MIDI作曲大賽,競賽內容包括日本與台灣民謠編曲,參賽者都是一些小學生,可見MIDI在日本有多麼普遍。目前最新的MIDI規格是GM Lite,對象是手機鈴聲,是GM標準的精簡版。

結語

  拉拉雜雜講了一大堆,從數位化講到CD再講到各種儲存媒介和數位音樂與電腦的關係,希望能讓讀者對於數位音樂有初步的認識。以上這些資料全部取材自網路上,網址文後附上。希望這點心得對拓展各位的視野有所幫助。最後要感謝網友Tiberius和JamesT的大力協助,提供了豐富的資料與技術支援,為這篇文章增色不少。

參考資料

DearHoney數位音樂工作室,http://www.dearhoney.idv.tw/

關於CD

Compact Disc The Inside Story,http://home.mira.net/~gnb/mac-cdis/index.html#conts
Nyquist Functions,http://www.cs.cmu.edu/~rbd/doc/nyquist/part6.html
CD-Recordable FAQ,http://www.cdrfaq.org/faq02.html
IEC-908…The BIG picture,http://www.ee.washington.edu/conselec/CE/kuhn/cdmulti/95×7/iec908.htm
Pre and De-Emphasis,http://www.batlabs.com/predemp.html
The Secrets of Dither,http://www.digido.com/ditheressay.html#RTFToC8
What is dither?,http://www.mtsu.edu/~dsmitche/rim420/reading/rim420_Dither.html
HDCD – About HDCD – Our Story,http://www.hdcd.com/about/ourstory.html
XRCD by JVC,http://www.xrcd.com/
DVD-Audio for High Quality Music,http://www.disctronics.co.uk/downloads/dvdaud.pdf
Sony Super Audio CD,http://interprod.imgusa.com/son-403/format.asp

關於MP3

MP3′ Tech – Overview of the MP3 techniques,http://www.mp3-tech.org/tech.html
Huffman Coding,http://www.rasip.fer.hr/research/compress/algorithms/fund/huffman/http://rkb.home.cern.ch/rkb/AN16pp/node124.html
Modified Discrete Cosine Transform (MDCT),http://www-ccrma.stanford.edu/~bosse/proj/node27.html
THE LAME Project,http://www.mp3dev.org/mp3/
網友 Tiberius 的 LAME 使用/參數說明,http://www.dearhoney.idv.tw/MP3/Encoder/Tiberius20001119/
MAD Plug-in For Winamp,http://www.mars.org/home/rob/proj/mpeg/mad-plugin/

關於MIDI

Stairway to Heaven,http://spinserve.com/stairway/
DearHoney數位音樂工作室MIDI博物館,http://www.dearhoney.idv.tw/MUSEUM/midi.htm
若遺園,http://gwanlin.tolmall.com/music.htm

相關討論

歷史上的今天...

Facebook留言

個留言

您可能也會喜歡…