Joe 好奇心遊記

Stereo & the Soundstage

By John Atkinson • Posted: Jan 4, 2008 • Published: Dec 4, 1986
(作者 : John Atkinson, 1986年12月4日出版, 2008年1月4日上網)

為避免防礙著作權，原文請至出處
http://www.stereophile.com/asweseeit/1286awsi

譯者前言 :

我發現對音樂家、音響迷、甚至錄音同好，解釋真正的 stereo 到底是什麼 ? stereo 必需具備什麼特質 ? 是一件極其困難的事。

事實上，市面上買得到的古典錄音，有超乎我們想像的比例，其實不是真的 stereo 錄音，雖然唱片封面上都標示著 stereo。

在錄音中呈現演奏者左一群、右一群的音像，大多數人，包括音樂家、音響迷，甚至是錄音人，常常就錯誤地認為這是 stereo。

這是一個錯誤的觀念，這是為什麼我將鼎鼎大名的 John Atkinson 論 Stereo & the Soundstage 這篇文章譯為中文的原因。本文指出什麼是真的 stereo 和 soundstage。

Soundstage, soundfield 和 ambience，在中文找不到合適的譯詞來區分它們字義之間微妙的不同，所以常都一致譯為 [ 音場 ]。但這樣的譯法，其實是誤導，本來要說分明的內容，反而在譯文中越讀越糊塗。

Soundfield/ambience 指的是一個場所的大、小、長/寬/高不同比率、形狀...所形成的反響/殘響特性，或者用通俗的話說 : [ 空間感 ]。在浴室、在教室、在音樂廳唱歌，那個 [ 空間感 ] 不同，這個說的就是 soundfield/ambience。

soundfield/ambience 談的只是空間感，不談音源方向性。

而 soundstage 談的，主要就是音源方向性。第一層次，左一、左二、左三....右一、右二、右三、正中央的歌者，在錄音中必需要能在兩支喇叭之間明確呈現每一個的位置。第二層次，第二排、第三排的歌者，最好在錄音中也能辨別他們的前後，整體的音像，呈現深度。

Sound image, 指的是 [ 音像 ]。Atkinson 在文中特別說明，當他引用到 sound image 時，指的是沒有深度感、在一個平面呈現的音像。

而 soundstage，Atkinson 指的是在 sound image 的平面以外，增加深度感的呈現。

文章中出現 sound image、sound imagery、soundstage、soundstaging....，它們的字義不能互換，因為我的功力不夠，無法找出中文合適對應的譯詞，所以在譯文保留原文。本譯文的重點在傳達觀念，為了避免不當的譯詞防礙傳遞訊息的正確性，關鍵的詞保留原文不譯出，應該無損本文之功能。

************************************

當今，重現 soundstage 的準確度 ------ 似乎和音響器材必需 [ 無音染 ] 一樣 ------ 是器材可以理直氣壯地歸類為 Hi-Fi 的最優先條件。若系統中的器材無法呈現好的 soundstage，系統的主人必然已偏離正道。但是，呈現 soundstage 的要素是什麼? 我知道這時你們會迫不急待地說 : [ 立體的音像 (stereo imaging) 必然與 soundstage有關 ]。

( Larry Archibald 指出 : [ 合成音像 ( imagery) 對 Hi-Fi來說，遠比好的文筆更無關連 ] ------ 我想我們應該會同意 : [ 好文筆，在 Hi-Fi 雜誌應該無容身之地 ] ----------若不是他這樣說，那我就會選用 stereo imagery(合成立體音像 ) 這個詞 )

到底”立體音像”( stereo imaging ) 是什麼?

( 譯註 : Larry Archibald 是 Stereophile 雜誌第二任老闆。

一般在技術領域，imagery 通常指多個 image ( 圖像 ) 合成一個大的 imagery。或是非圖像的資訊，轉成肉眼可見的圖像。所以 imagery 譯為合成音像。)

Silence.
聽眾席一片無聲

後面有人舉手發問了 : 不是說，好的立體音像與系統在兩支喇叭間的橫向平面準確定位音像的能力有關嗎?

答 : 是，又不是。如同 AJ van den Hul 在本期訪談中指出，很多 Hi-Fi 系統有很好的立體 ( 左---右 ) 定位 ( imaging )，但呈現的音像( image ) 是平面的、像壁紙。這一點，是一般價廉的 CD 播放機典型的特性 : 呈現明確的 ( well-defined ) 的平面音像，但缺少必要的深度。

這時有人笑了。顯然，好的 soundstaging ( 音像定位 ) 是依賴系統重現錄下來的殘響音尾 ----- 也就是現場殘響特質 ( ambience ) ---- 的能力。

這個 ...... 對、也不對。單聲道的78轉唱片可以準確地重播殘響，可是沒人能說單聲道的系統有任何重現 soundstaging ( 音像定位 ) 的能力。因此，我們可以說，它與這個無人可質疑的事實 ------------ 所有人 (聽的方式) 都是用兩股訊號、驅動兩支喇叭、產生兩組聲波在我們的兩耳滙合，這樣的機制 ( system ) --------- 有關。

這時，幾個基本(論述)應該提出來。本期有個評論是有歷史地位的 AES 關於 stereo 的文選、。文選中有一篇(本月將屆55年歷史)，將立體重播 ( stereo reproduction ) 有關的範圍、包括 ( LP ) 45/45 度立體溝漕/動鐵唱頭，幾乎都全貌定義清楚。這個1931年英國工程師 Alan Dower Blumlein 呈給英國專利局的申請文值得在此引述 :

“本發明的基本目標，是提供錄音、重播、傳播系統可以藉由傳達經兩個路徑的音訊給聽者，使他得到與日常生活聽覺相同真實的(音)印象，並且提供聽者真實的(音源)方向性的印象………在房間的聽者用兩支耳朵來聽，反射音帶著方向性的資訊傳給聽者，使聽者對實際在房內演奏所聽到的經驗相符合……….當這個音樂由單聲道重播時，反射音與直接音都來自同一個發聲點(單支喇叭)，因此引起混淆。這個發明的相關目標是在聲音中置入方向資訊，所以重播時，反射音可以被正確地感知為反射音”( 註 1 )

換句話說，若錄音時，不只是將聲音錄下，也把音源在空間的方向性資訊也錄下，加上，把構成 soundstage 的每一道聲波、連同它們的反射波 (殘響 or 迴音) 也記錄下來，那麼，就有能力將原始 soundstage 所有細節擬真重現。更進一步說，因為直接音與反射音在空間中的關係有被記錄下來，所以重現的 soundstage 可以提供一個擬真、帶有深度的幻像。

Blumlein 的專利申請中提到 : 使用兩支與耳朵等距的麥克風錄音、並用耳機重播是將 soundstage 資訊完整保留的最簡單方法，這就是 "雙耳" 技術 (binaural)。不過，這使得耳機重播是唯一的方式。歷史已證明，多人一起聆聽時，耳機就像感冒一樣不受歡迎。Blumlein 考量到用喇叭重播，提出以記錄兩組音訊間的"振幅差" 而將音源方向資訊錄下的方式。

( 譯註 : binaural 就是俗稱假人頭的錄音技術 )

有人小聲地問 : 人耳/大腦應該不單只用 "振幅差" 這個資訊來辨別音源方向吧?

沒錯。在2KHz以上，大腦確實用雙耳收到的 "振幅差" 來辨別音源方向。但是在 700Hz以下，大腦辨別方向是藉由兩耳接收到的 "相位差";也就是用了時間資訊。(上述的兩個頻率區都與頭部尺寸有關，所以兩個頻率區起始點會因人而有些許差異) 在兩個頻率 (700-2000Hz) 間的聲波，看法就比較多樣了。不過，仍有兩個機制有作用，第一，因著耳廓接收不同角度的音源而對頻率響應作相應的改變，第二，頭部是緊接著 (continual下一階段)、橫向的機制(motion)，藉著引進第二階(second order) (變動率)資訊，會強化這所有的機轉。其結果，人---還有動物-----對聲音來源的辨別力(除非碰巧聲波內含特殊音高的”純音”，有如鳥類用來作警示音。)

Blumlein 的天才，在於他理解低頻的相位資訊可以用相對應的振幅資訊來取代。

假設有兩股獨立的音訊,各自供應訊號給對應的喇叭, 兩支喇叭間的振幅比率就可以為坐在正中的聽者定義出虛擬、幻象的音源位置。兩支喇叭不同的音量的比率所呈現的虛像, 會位於兩支喇叭間的某個點。這無數個虛像所形成的無數點，它們的比率，自 左極大 / 右 0 -------- 至 ------- 左 0 / 右極大，形成我們熟知的立體音像。

若無殘響資訊, 大腦會將這個虛像的位置投射在兩支喇叭間的平面上。

若殘響、還有它與直接音在空間中相對關係的資訊有正確記錄, 也就是說有 “一體性” ( coherent )，這時, 人腦會將聲音的虛像投射在兩支喇叭後方的平面上，而向後退縮多遠, 取決於直接音/反射音的比率。

(註 : coherent，在物理上，是指兩道波動之間有 “可干性”(可彼此干擾)、”同調性”。查考網路上對 coherent 的說明，提到 coherent 波其中的一種 : “一個波，若經複製成兩道波，則兩者之間即有可干性”。這與本文所討論的音場，似為相關聯的特性。我的理解是，Atkinson 想說的，是這一件事 : [ ------ 收錄的反射波，必需與直接音是同一音源，經由不同路徑、時間、以不同的相位、抵達同一支麥克風 ------ ]。所以，我將 coherent 譯為 “一體的”。)

所以，藉著用兩聲道系統錄下 "振幅差"資訊，我們可以在喇叭、或喇叭後方構築一個虛擬的 soundstage。

一堆人舉手發問 : 但是….但是, 兩耳總會同時收到兩支喇叭的聲音。難到這個串音不會抵消虛擬音像的形成嗎?

簡化的答案是 : 多數的聽者已經(實證)可以感知到立體音像，所以串音不會抵消虛像的形成。

真正的答案是 : 人腦有能力區分哪一耳該聽哪一支喇叭，這與你讀到 Polk (喇叭)公司的廣告剛好相反。聲波自左喇叭抵達左耳時，人耳明白那同一道波需要 0.7毫秒繞過臉部後才會抵達右耳，因此會忽略它。

到這裡，解決方案有了 : 一個完美的音像、等同 (implies) 完美的 soundstage。發燒友園地這時開花結果了。

嗯 --- [ 完美 ] 這個詞很可疑。陷井在哪 ?

嗯 ----- 目前我們只談到了兩支喇叭間、還有喇叭與聽者間的互動關係。那麼，只用兩聲道單單記錄 “振幅差”，這是怎麼一回事 ?

論到音樂錄音，有兩種互相排斥的觀念。

第一種，是儘可能地收錄現場整群演奏者的自然聲響，等於實務上，將演出視為單一個整體以作歷史記錄片的心態保存下來。

第二種，遠比第一種廣為採用的，是將 "錄音" 這件事作為主體、或是演出的一部分，將現場的聲音視為生的食材，事後再調配、烹煮。當然，非古典形式的音樂都是這樣錄的。每位演奏者、歌者，都單獨由專用麥克風拾取為單聲道音訊，當場或事後，再將每一單聲軌用panpot (混音機上調整左右聲道比率的鈕)設定單一音源在音體音像中的位置。既然，照定義說，Panpot就是調整兩聲道之間的 "振幅比率" 的設備，用這樣方法錄下來的，應該是道地含有"振幅差"的立體錄音，可以呈現明確的立體音像。

不過，這種錄音呈現的 soundstage 與真正的音像有關聯嗎 ?

有些時候

製作這種錄音時，製作人決定單獨每一個單聲道要有多少殘響、哪一種殘響、還有殘響的虛擬位置在何處。

以位於中央的的主唱來說，其周圍 (以人工製造) 的聲場，與鼓周圍 (以人工製造) 的聲場，實在找不出理由可以說兩者之間有任何 (實體上的) 互動關係 ( relationship )。與吉他、或與音源器，情形都一樣。既然 (在錄音中) 沒有互動關係，那聽者無法聽到 soundstage，相反地，他聽到是每個獨立 (不相干) 的演出所拼貼起來的的結果，每個 (演奏者) 彼此在空間中毫無互動關係。

早期的搖滾錄音，例如 Airplane 的 After Bathing at Baxter’s, 就是個鮮明的例子。雖然，它毫無疑問地在音樂性上使人滿意，但它就是沒有 soundstage。從1960年代開始，幾乎所有的搖滾樂製作人都會小心處理人工音場 ( ambience ) 以呈現有說服力的 soundstage。以 Paul Simon, Andreas Vollenweider, Clannad 的錄音為例，呈現全然人工製造、但有效的、位於喇叭之間、或其後的 soundstage，而 ( 演出者 ) 在現場的互動關係可能是完全不存在的。
________________________________________

註 1 : Blumlein這篇滑溜溜、不文雅、分句不佳、法律術語的文章，其實說的是”保存(在橫向的平面lateral)方向資訊"
負責為Meridian 品牌作許多優秀錄音的John Shuttleworth曾經指出 : 因為反射音也會經由地板、天花板反射，能夠提供人耳音像高度印象的資訊也會被收錄保存。但這是個危險的範疇，我暫且不申論，將來再討論。

註 2 : 發明Ambisonics (一種3D錄音方式) 的名人Michael Gerzon，在1986年7月的Stereophile有一篇引人入勝的文章，概述如何在Blumlein麥克風收音方式中增加低音在兩聲道道間的差異，可以增加soundstage的寬度。這個，又是從Blumlein1931年的發想另一個直接推論。

古典音樂錄音，我們談的可是現場實際要素 (非虛擬) 的呈限。作曲家、指揮、演奏者、甚至音樂廳的設計人共同努力為要呈現給現場演出的聽眾一個真實、音樂性平衡的音像。因此有人會想，必需要作的，不過是用兩聲道把所有(音源) 在空間的互動關係以”振幅差”資訊的形式記錄，來錄下音像。無疑地，其結果就是立體的音像和真實的 soundstage 兩者俱備。

沒錯，就是如此。但是，很少這樣作。

一般來說，大公司出品古典音樂錄音，其製作方式彷彿它們是搖滾音樂錄音。每支樂器、或每組樂器(聲部)都有其專用麥克風，工程師調整平衡鈕將每個麥克風的輸出(定位)在一個扇形台面，有時控制輸出幅度來模擬現場的平衡、更多時候，反而是”優化”到作曲家認為正確(的聲部平衡)。另有架在關鍵位置的麥克風收錄現場殘響；甚至加入了人工的電子殘響來補足(音像)畫面上某些空洞以完成人工製造的soundstage。其結果，若是有天份的製作人、工程師為之，可以達到令人驚訝的現場擬真程度。不過，當你認真聽，可以發現拼貼 (在音像) 的個體，彼此之間的”連結”過度地清晰，特別是重播的媒體………怎麼說呢?........捨棄某些會朦朧化這些”連結”的細節的時候。再次，有了 (stereo image) 真實的音像，但soundstage呢 ? 經常是不夠的。

不過，我們是發燒友，不是嗎? 我們都明白 [ 輕視多軌錄音 ] 這件事的可怕，不是嗎? 我們信任 “極簡” 麥克風技法還有 “誠實” 的錄音。我們相信 “音像” 還有 “soundstage” 的存在。

極簡” 麥克風技法-------簡單的概念，確定嗎? 在交響樂團前、模擬喇叭重現音場的位置、擺個兩、三支麥克風，就大事底定，不是嗎 ?

嗯…..是，也不是。真正的音像是由單單含有”振幅差”資訊的兩聲道音訊來重現。如果說，麥克風拉開大間隔，大於大多樂音波長的一半 ------ 例如10英尺，會怎樣? 除非音源剛好與兩支麥克風等距，否則，除了”振幅差”以外，還會在聲道間的電氣訊號引進時間差。這個”時間差”會將音源的音像拉到最近的喇叭，呈現中央部位不穩定的音像，並且容易使音像分別聚集在 (單一個) 喇叭周圍。再加上，非單點的麥克風收音，兩聲道間的”振幅差”，與不同音源的角度變化的關係，並不是線性的。因此，根本難以想像非單點的麥克風收音能產生任何音像 ( image )。

這個論點，可以由下列這個錄音呈現…..Delos的 Stan Ricker用兩支相隔12英尺全指向(omni)麥克風所錄的拉威爾四重奏。這個錄音飽滿、鮮活且有極好的空間感。但它的兩聲道間在時間上的不一致如此地大，因此，根本不應該被稱為立體錄音。相反，它是對同一場演出的不同錄音的同步重播。

“有差嗎”? 沒錯，而且很容易證明。

喇叭重播時應該相位一致，真實的立體錄音會呈現兩支喇叭相當程度的關聯性，例如，同一聲音會同時在兩支喇叭、以不同強度出現。若喇叭相位不一致，這個關聯性(correlation, 譯註 : 請讀者回想一下前面提到的 coherent)會引起聲波相互抵消還有相位效果，我相信這是讀者(發燒友)都知道的。

若重接線，使喇叭相位不一致，來播放這張Delos唱片，你會聽不出差別(與喇叭相位一致相比)。錄下的這個”時間資訊”徹底地掩蓋了喇叭相位不一致的事實

如果兩支麥克風不具備足夠兩聲道間的關聯性，為什不在中央加一支麥克風，輸出到左、右聲道? 這樣不就會把音像的中央部分拉近並強化?

嗯….是，又不是。

這是典型的 Mercury Living Presence 技術，近年 Telarc 的 Jack Renner 也呼應並得到成功。如此，音場中央部分音像穩定、感到整體聲音比較明確、因著全指向性麥克風對音樂忠實的特性、得到空間感、深度。

但是，有呈現真的音像嗎(譯註 : 要注意這裡說的是音像 sound image)?

沒有，因為原始的方向資訊只是大略地被保存。所以，不但音像 ( sound image )不存，也無真實的soundstage。

大距離相隔的麥克風的錄音類似印象派畫作; 是視覺享受且令人激動，但細看時，一點都不真實。

要使錄音有能力呈現真實的 soundstage，必需回歸到 Blumlein 1931年的論文，其中所勾勒…….能輸出與音源角度有正確線性關係的”振幅差”資訊的雙麥克風技術。

這種技術的

第一種 : M-S技術，是用8字型、向側邊收音的麥克風，與置於同一點、面向前的麥克風組成。1950年代重新受到重視，這個技術呈現的是兩組訊號之 [ 和 ]及 [ 差 ] 兩個輸出。這也是”全音場麥克風”(Soundfield, 也稱為 Ambisonics, 前面提到的Michael Gerzon所發明 )的基本原理。

第二種 : 兩支8字型麥克風在水平面互為90度角，各自以45度角朝向左前、右前。這是EMI在早期、也是James Boyk錄鋼琴、最近Sheffield錄”火鳥”的收音技術。

在所謂的”極簡”技術中，只有這兩種、連同其衍生的變型，可以自兩支喇叭重現真正的立體音像。其結果，只有這種技術在錄古典音樂時有能力呈現好的soundstage。

我當然不是說只有用這種收音方式錄的才值得聽。這個針對音像的討論排除了同等重要的收音要素-------頻率響應、平衡、麥克風音染、失真、噪訊、保留真正的音樂動態、音樂廳聲場品質、直接音/殘響間最佳的比例，甚至是尋找最佳麥克風位置的時間。當這所有因素都要考慮時，任一位好的錄音師有時不免需要告訴你----以Blumlein對”振幅差”的角度來想------不得不犧牲”真實立體音像”以換取在別的因素上的效益。若其成果，以音樂性考量，是值得的，那麼，有何不可?

真的沒理由說不可。對於藝術，總是可以為使用的手段編出個理由。但是 ------那些為文-------論錄音、從技術觀點論錄音方法如何保存或被 hi-fi 器材改變-------的人，有義務要厘清哪些屬性是屬硬體、哪些屬軟體。下一次你再讀到作者特別強調某器材的 soundstaging 的時候，問問你自己，到底他是引用一個真正能呈現真實 soundstage 的軟體，或者，實際上，他只是被他自己的耳朵引到不合邏輯的推論。

2014年7月21日 星期一

2014年7月21日星期一