パスワードを忘れた? アカウント作成
704108 journal

ttの日記: わかったきぶん(自分向けメモ)

日記 by tt
さて先週末はLAMEのsubstep noise shapingの音質を改善する、という事に関して、「耳につくノイズは400Hzあたりにあるから」という観察結果(ずるしてスペアナを見たとも言う;p)から、600Hz以下ではsubstep noise shapingを行わないように変更して、Tom's Diner問題を解決した…が、やっぱりあまりにもadhocすぎる。もうちょっと理論的に物事を考えてみる。

ぽく、ぽく、ぽく、ぽく、、、、、ちーん(一休さん風)

低い周波数帯域においては周波数分解能が不足するため、音響心理解析の精度が低くなっている可能性が高い。このため心理解析の最小単位であるpartition bandの幅がFFTスペクトルにして数本程度しかない周波数帯域におけるマスキングの計算は余り信頼できない。

こういった領域ではsubstep noise shapingのような「音響心理解析の結果を完全に信じて、マスキング許容量ぎりぎりまで量子化ノイズを増やす」という手法をとるのはリスクが大きい。

またそのような低周波領域ではscalefactor bandの幅も狭いので、substep noise shapingを行った結果、発生するノイズも狭帯域トーンとなる可能性が高く、ノイズが耳につく可能性が高い。

二つの問題点のうち前者はより長いFFT窓を使って音響心理解析を行えば解決するが、後者を解決するにはノイズ量の見積もり方法として今までとはまったく違う方法を取る必要が出てくる。

ということで、とりあえずできるsubstep noise shapingの問題点解決には、「ある程度以下の幅しかないscalefactor bandあるいはpartition bandに相当する周波数帯域ではsubstep shapingを行わない」であると思われる。

ううむいい感じで理論的考察が出来たぜ

さて、、、、どうやって英語にして説明するかな(泣)。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

人生unstable -- あるハッカー

読み込み中...