ttの日記: その2:人の耳、俺の耳
まず、はっきり言えることは、自分の耳が一番ということである。これだけは誰がなんと言おうと譲れない。でもってもうひとつ重要なのは、「ちゃんとダブルブラインドで」やることだ。ブラシーボ効果があるためである。一回f特とかを見たりしたあとに聞くのは最悪である。あと、何度も何度も繰り返し聞いて評価するのもあまりよくないという人もいるが、これは別にどーでもいいかと。ただ、高いビットレートほど、何度も聞くと耳が腐ってきて差がわからなくなるのは確かなようだ。
などとえらそうなことを言っておいてなんだが、正直に言おう、私の耳はよくない。高い周波数の音が聞こえるという意味では優れている(だいたい20kHzぐらいまでは聞こえるし、24kHzぐらいまでも「感じ取れ」る)が、そのほかに関しては人並みである。高音さえ出ていればあんまり差はわからない。手っ取り早く言うと、「現在の」LAMEが作るmp3なら128kbps少々のVBRかABRで特に文句はない、というか、元の音声と違いがわからないか、わかっても特に文句をつけるほどではない。
実を言うと、私は他の人の耳の実力を疑っていた。いわゆる、オーディオ雑誌に書いてある機械の評価なんて、半分電波だと思い込んでいた。ゴールデンイヤーなんて、ちと、言い過ぎちゃうんかいなと。いてもそんなあちこちに何人もいるもんじゃないに違いないと。
しかし最近、単にそれは自分の耳が悪いだけとわかった。悲しいけれど。それは、某無記名巨大掲示板のあるスレッドでわかったことである。
mp3のデコーダの音質をホゲ、という話題だっただろうか。各種デコーダのはいたwavファイルを聞いて、デコーダを当てるという奴である。流石にエンコーダを変えたら私でもわかる。明確にバグのあるデコーダを使って、音が飛んだり明らかにわかるノイズが鳴れば、それもまたわかる。しかし、、、、しかしだ。それなりに十分な精度を持ったデコーダであれば、どのデコーダを使おうがそんなに変わらないと言うのが私の「思い込み」であった。だって、16bitフルスケールのうち、結構振幅が大きめのところでも、1LSB~3LSBぐらいしか違わないんですよ?
しかし世の中、思い込みで動いてはいけない、と気づくのに時間はかからなかった。その、たったの3/32768ぐらいの違いしかないwavファイルを聞いて、デコーダを当てる人が続出していたのだ。
思い込みがなんとばかげていたか、そして、たとえすでに自覚していても、明確に自分が劣等の種であると宣告されたかのような、二重の衝撃をうけたのだった。
なおそれ以来、私は音声処理のプログラムにおいて計算誤差をまじめに考えるようになった。どーせLSBが変わるぐらいの誤差があっても人の耳には違いはわかるめー、と思っていたが、そうではないとはっきりわかったからである。
ということで、早くLAMEのMDCTとかのコード書きなおさないとだ、、、
その2 More ログイン