オーディオの科学

 圧縮音は音が悪い? 2008.2.19

デジタルテレビやiPod など最近は音声・音楽を圧縮音源から再生する機会が増えている。オーディオマニアは当然のように「圧縮音源の音などとんでもない」と毛嫌いする人が多いと思うが本当だろうか? ここではあくまでデータを基にその真偽を調べてみる。

非可逆圧縮の種類

音声圧縮の原理やフォーマットはWikipedia に任せるとして、ここでは現在最も広く使われているMP3とAAC(Advanced Audio Coding)方式を取り上げる。AACの方が後発でそれだけに高音質だと言われている。ここに、AAC圧縮の比較的わかりやすい解説を紹介しておく。出典は以前メモしておいたデジタル技術の啓蒙書だが書籍名は失念してしまった。

なお、ここで高音質というのは原音に対する理論的な忠実度が高いことをいい、聴いていい音という意味ではない。また、同じ圧縮法であれば1秒間に送られるビット数すなわちビットレート(単位 kbps)が大きいほど高音質となる。ただし、ビットレートは情報量に応じて変動する可変ビットレートの場合もあるので、このページでの値は平均値または下限値を示すと理解してほしい。

圧縮音源の音質は必ずブラインドテストによって確かめられている

天動説から地動説へのページに書いたように我が国では音響機器のブラインドテストによる評価はタブー視され決して行われることはない。その理由は自明で、これを行うとそもそもオーディオ業というものが成り立たないからである。しかし、音声圧縮技術は事情を異にする。これは、似非科学が蔓延する偏狭で古い体質のオーディオ界を対象とするのではなく、デジタルテレビや音楽配信、携帯音響機器といった、これから大きな需要が見込まれる最新の音響機器に必修の技術であり、音質の劣化を感じさせない範囲でどこまでデータ量を圧縮することが可能かをブラインドテストにより評価することはきわめて重要であり、最新の音響心理学やデジタル情報理論をマスターした第一線の技術者が投入され開発に当たっている。

このとき、他の音響機器の評価と異なり、圧縮音源と元音源の違いを操作が分からないように変えて実施するのは、コンピュータソフトのみで簡単に行えるので、完璧なダブルブラインドテストが容易に実施できることも幸いしている。

ここに、この分野におけるブラインドテストの重要性を解説した少々辛口のサイトを紹介しておく。
http://anonymousriver.hp.infoseek.co.jp/

この中の「オーディオ圧縮技術の音質について」はおおいに参考になる。私もこのサイトの主張に大旨賛成である。

上のサイトすでに閉じられているようでアーカイブサイトへのリンクをつけておく(2012.2.16)
(初めて開くときは少し時間が掛かるかもしれません)

http://web.archive.org/web/20080108105855/http://anonymousriver.hp.infoseek.co.jp/Audio-Codecs.html

ビットレートと音質評価

こちらのサイトにはビットレートを変えた圧縮音源とPCM WAVファイル(CDの音と同じ)の音質の差が分かるかどうかをブラインドテストした結果が掲載されている。ただし、フォーマットが何か書いていない。

http://plusd.itmedia.co.jp/lifestyle/articles/0504/14/news003_2.html

被験者は音のプロ220人で、結果は100kbps を境にこれ以上だと差がほとんど分からないか、分かっても気にならない程度であるという。デジタルBSのBモードステレオのビットレートやiPodのデフォルトレートは128kbps 以上なので、微妙なところにあり若くて耳のいい人には差が分かるかもしれないといって程度であろう。

ビットレートの違いは何に反映されるのか?

ビットレートが違うとなぜ音に違いが出てくるのか? という疑問に正確に答えるには圧縮の原理を理解する必要があり、これは音響心理学や、情報理論の基礎がないとなかなか難解である。最も大きく反映されるのは再生音の周波数特性で、特に高域のカットオフ周波数の違いとして現れる。以下のサイトは異なったビットレートの再生音の周波数特性を示す。

http://www.watch.impress.co.jp/av/docs/20010521/dal11.htm
こちらはMP3の周波数特性で、通常の 128kbps のレートで16kHz以上は急激にレベルが低下する。しかし、128kHz以上にビットレートを上げてもあまり改善されないようである。

http://www.watch.impress.co.jp/av/docs/20050829/dal203.htm
このページの「iTunesのAACエンコーダは向上」を見てください。こちらはAACの周波数特性です。

128kbps でも18kHz までほぼフラットで mp3より優秀で、周波数特性だけ見るなら原音と区別し難いだろう。


一方、人間の聴覚の能力として可聴周波数範囲はよく 20Hz 〜 20kHz といわれるが、これは20歳以下の若者の特に耳のよい少数の人について言えることであり、実際には16kHz 程度が限界のようである。さらに、加齢とともに高音の閾値はさらに低下する。具体的にはここにグラフで示されているように50歳をすぎれば11kHz くらいまで低下し、70に近い私なども測ってみると通常の音量では10kHz が辛うじて分かる程度になっており、iPod で使っている 128kbps のAAC 圧縮だと非圧縮のCDと区別がつかないのは当前のことのようである。

色々なメディアの圧縮方式

iPod: 私も愛用している代表的なディジタル携帯音楽プレーヤであるが、通常CDをiTunes(Mac の音楽ソフト Windows 用もある)で圧縮しパソコンに記録しiPod とUSBケーブルで接続すると自動的に同期しiPod に送られる。 iTune のデフォルトは128kbps のAAC であるが mp3 にも対応し、ビットレートも320 kbps まで上げることが可能である。

ところで、市場ではiPodより高音質であると宣伝している携帯プレーヤが数多あるが、携帯プレーヤーの音質は、ステレオシステムの音質がほとんどスピーカーで決まるように、イアフォン(ヘッドフォン)できまる。従って、同じイアフォンを使って試聴しないと公平な比較は出来ない。 正直 iPod 付属のイアフォンはちょっといただけない。いろいろ試してみたが、現在はSonyのMDR-EX90SL という半密閉型イアフォンを使っている。装着部が特殊な形状をしており低音の抜けが少なく高音質である。実はこれ以前にもう少し高価なイアフォンを使っていたが、低音の抜けが激しくイアパッドを付けないと使い物にならない音だったので買い換えた。恐らく本体の音質は機種によりほとんど変わらないだろう。いずれにせよiPod の良さはiTunes との連携を含め、その使い勝手の良さである。

ネットからのダウンロード(音楽配信)iTunes Store のサイトからダウンロード出来る音源は標準で上のiPod と同じく 128kbps のAAC ようである。格安のダウンロードサイト SONGJP 等だとmp3 が主流である。高音質配信を売り物にしている「e-onkyo」サイトでは24bit,96kHz の高音質ソースをロスレス圧縮で提供している。

テレビの音声:本文にも書いたが現在最も高音質の放送はアナロクBSテレビのBモードステレオでサンプリング周波数 48kHz 16bit のリニアPCM でCDより高音質の非圧縮音源である。当然周波数特性は 20kHz まで保証している。残念ながらこの放送は2011年に終了する予定である。Aモードステレオは 36kHz,14bit で15kHz まで保証している。5.1ch などのサラウンド音声の場合はAモードを使用している。注意してほしいのは、古い録音の放送などはAモードを使うことが多いが、これは元々ソースの音質が悪くBモードにする必要がないからであり、音源さえよければハイビジョン放送の5.1 サラウンド番組を聴けば分かるが普通の人にはBモードと区別がつかない音質である。

これから主流となるデジタルテレビの音声はBS(ハイビジョンを含む)、地上波ともに AAC圧縮で放送されている。やはりAモード、Bモード、5.1ch などがある。転送レートは標準で144kbps ということである。これなら、上のデータから見て非圧縮のPCMの場合とブラインドでは区別がつかないはずである。

で、私の主観では

最近はiPodやBSデジタルテレビの音を聴くことが多いが、iPod では普通はデフォルトのAAC、128kbps で圧縮して保存しているが、特に高音質を謳ったCDの一部は192kbps モードも使っている。しかし、128kbps で圧縮してもソースが高音質であればやはり高音質であり 転送速度の差よりソースの録音の質の差がずっと大きい。また、メイン ステレオシステムで聴くと歪みっぽくて聴きづらいCDがむしろ聴きやすい音になることがある。もともと人間の聴覚の特性を考慮し聴きやすい音にしてあるAAC圧縮の特性かもしれない。

BS放送の録画は出来る限りレコーダ付属のアナログチューナを使っている。これだと、非圧縮PCMなので安心である。もちろんコピーワンスのガードが入っていないのも魅力である。同じ番組がハイビジョンでも放送されることが多いが、無意識に聴いていると音質の区別はつかない。時々5.1ch サラウンドの放送があるがリアスピーカは使っていないので2chのステレオで聴くことになる。この場合、Aモード相当のAAC圧縮なので15kHzまでしか再生していないことになり、心理的には物足りない感があるが、 それを知らずに聴くと恐らく差は分からないだろう。 たまたまあるオーディオの掲示板を見ていると、5.1ch サラウンドの音を最高と評価している人がいたがこういう事実を知ると恐らく評価が変わるんではないかと推察する。また最近我が家でも導入した地デジ対応のレコーダで録画したものも、地上アナログ放送よりずっと高音質である。特にノイズレベルの差が大きい。

結論的には、128kbps 以上の伝送レートであればAAC圧縮の音は、理論的にはより高音質のはずのハイビットハイサンプリングのリニアPCMやSACDと比較しても私には差はよく分からない。もちろん、高音質の録音、そうでない録音の差はいつも感じるが、それはフォーマットの差ではなくソースの録音品質の差に帰せられる。

百聞は一聴にしかず

ということで音源のサイトを作りました。

こちらです。