パスワードを忘れた? アカウント作成
13820764 story
音楽

低ビットレートのMP3で圧縮された音楽はネガティブな印象を受けやすいという研究結果 42

ストーリー by hylom
そりゃそうだ 部門より

MP3で圧縮された音源はそうでない音源と比べて、聞いた時によりネガティブな印象が強くなるという研究結果が発表されたそうだ(GIGAZINE論文)。

この研究結果は香港科技大学の研究者らが発表したもので、MP3圧縮によって音源に付与される「growl」(うなるような音)が原因の1つだと分析されている。ただし、論文ではMP3での圧縮に使用したビットレートが「32Kbps、56Kbps、112Kbps」と一般的に使用されているビットレートよりも低い。このようなビットレートでは音質劣化が大きく、特に高い周波数の音を出す楽器の音は大きく劣化する傾向があることも原因の1つではないかと推測できる。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • で、差が有意に出るまでビットレートを下げていったら32Kbpsという誰も使ってないような低いビットレートでの実験結果しか出せなかった、とかいう落ち

    • by Anonymous Coward on 2019年01月22日 22時26分 (#3552639)

      32kbpsというとエロゲーの音声を詰め込むときに使ったぞ
      あれネガティブになってたのか

      親コメント
      • by Anonymous Coward

        プレイヤーを後ろめたい気分にさせる
        →いけないことをしているような気分にさせる
        →(一部の人は)より興奮する

        てな効果が結果的に得られていたということで。

        #昔の画質の悪い裏ビデオ的な・・

      • by Anonymous Coward

        PHS [wikipedia.org]自慢の「クリアな音声」をー
        バカにスンナー

        #人の音声はPCMの64kbpsでほぼ問題ない。

    • by Anonymous Coward

      そういう事をちゃんと研究レベルではっきりさせておくことは有意義だと思うけれど。

      • by Anonymous Coward

        でもそういうのって、不可逆音声圧縮技術の開発や規格の策定の場で、その理論的根拠として
        ちゃんと研究されていたはずだと思うんだけど。

    • by Anonymous Coward

      mp3の128kbpsだとハイハットとか金属系の高音がうねってるのがまだ気になるので、最低192kbpsは必要です。
      AACだと128kbpsでも大丈夫かな

      • by Anonymous Coward

        WMAも結構高音域の圧縮は優秀で、128kbpsも許容範囲として使っていたんですが

        その後、iPodの時代が到来。WMAが再生できなくなって……192kbpsのMP3で圧縮しとけば良かった

    • by Anonymous Coward

      ネット配信とかでフォールバック先に低ビットレートなMP3が有ったりするので現役だよ。
      # 世の中ダイアルアップもまだ居るのだ。

    • by Anonymous Coward

      192kbps以上は有意な差は出にくい、128kbpsを下回ったら極端に音質が低下するって話なら聞いたことあるが。

      なので後発のcodecは主に低ビットレートでの音質向上に取り組んでる。
      320kbpsならmp3だろうがAACだろうが測定上の特性も変わらん。

      • by Anonymous Coward

        320kbpsだと非圧縮のCDとの差を聞き分けられる人も
        比率的にはそんなにいないと思う。

        ※radikoはビットレートをケチりすぎじゃないかな

        • by Anonymous Coward

          自分は若い頃は明確に聞き分けられた。
          今は自信無いな。エンコーダーの品質も上がってるし。耳も劣化してるし。

          それと、別スレにデコーダーの品質問題が出てたから、その影響もあるかもね。
          Winamp用の高音質mp3再生プラグインとか使ってたなぁ。たしかに気持ち程度だけど音良かったね。

          んで、当時の検討では、192kbps食わせればOK、VBRなら平均160kbpsぐらいでも良い、って結果を得たな。
          128kpsはNG。VBRなら聞けるけど避けたい感じであった。
          余裕見て、VBRなら192k、CBRなら256kで作ってたね。

          128k切る低ビットレートなら、22KHzにした方が良かったな…。

  • by miyuri (33181) on 2019年01月22日 22時35分 (#3552643) 日記

    1.4 Listening Test
    There were 20 undergraduate students hired for the listening test.
    All subjects were fluent in English and were undergraduate students at the Hong Kong University of Science and Technology, where the medium of all instruction is English.

    聴く側の文化によって、結果はソコソコ変化するかもしらない。

  • by Anonymous Coward on 2019年01月22日 21時28分 (#3552601)

    この研究にどんな新規性があるの?
    心理的な印象に影響があるという結果?
    >高い周波数の音を出す楽器の音は大きく劣化
    あたりまえやん。FFTしてみれば(してみるまでもなく)
    16kHz辺りでバッサリ切られてる。大体FM放送位。
    さらに有色のノイズが入り込む。
    プリエコーとか、因果律に反するノイズとかね。
    子供が圧縮音源ばかり聞いているので、CD聞かせたら
    音の良さに驚いたって言ってた。
    並みのCDだったんだけどなぁ。

    • by Anonymous Coward

      16KHz以上が削られても劣化と認識されにくい周波数帯域だから。
      安いイヤフォンでは大きく減衰している周波数だし、iTunes配信のaacでも削られている周波数だが文句を言っているのはオーディオマニアくらい。

      • by Anonymous Coward

        子供だから、でしょ
        加齢に従って高周波は聞こえ難くなっていく

        • by Anonymous Coward

          加齢によって聞こえにくくなるのか実は立証されてないはず。
          若くても16KHz以上が聞こえていない人は実は珍しくなく、それは遺伝的要因がある事がわかっている。
          そして生活環境的に高音聴力低下の要素がなかったのかの判別が可能な統計的情報が見当たらない。

          それにCDよりiTunesの音を選んだのは若者が先で、劣化が認識されているなら圧縮音源を聴いて「良い音」なんて感想が出ていた事と矛盾する。

          • by Anonymous Coward

            #3552728

            劣化が認識されているなら圧縮音源を聴いて「良い音」なんて感想が出ていた事と矛盾する。

            #3552601

            CD聞かせたら 音の良さに驚いたって言ってた。

            元コメについて述べてるなら逆ですよ、取り違えていませんか?

            それに加齢による高音域の聴力損失は統計上明らかです。
            先天性であろうが生活環境で左右されようが、年代別の集団として傾向がわかっています。

            • by Anonymous Coward

              元コメについて書いていませんよ。
              元コメのどこに圧縮音源を聴いて良い音と言ったなんて書いてあるんです?
              劣化が認識されていないから圧縮音源に不満のない人が多数なんだよ。

              だからその統計が加齢に原因があることを証明できていないんだよ。
              単に年齢が高いほど高音域の聴力が低下している人が多かったと言うだけで、生活環境などに原因がなかったのかの調査ができていない。

              • by Anonymous Coward

                若いときは問題なかった人が歳を取ると「さ行」の音が聞き取りにくくなるなんてのは加齢が原因だろ?

    • by Anonymous Coward

      タレコミにも書いてある意見で何を長々とイキってるんですか

    • by Anonymous Coward

      > この研究にどんな新規性があるの?

      とりあえずどれか答えて。

      1. 論文を読んだけど、本当に新規性が理解できなかった
      2. 論文を読んでないけど、とにかくケチを付けたい
      3. 論文が、"心理的な印象に影響がある" ことを新規性として主張していると思い込んだ
      4. 論文が、"高い周波数の音を出す楽器の音は大きく劣化する傾向がある" ことを新規性として主張していると思い込んだ

    • by Anonymous Coward

      分かってるじゃん。まさに、mp3圧縮が音の印象にどのような影響を及ぼすか分かったというのが新規性ですよ。
      元論文のAbstractより:

      This paper investigates the effects of MP3 compression on the emotional characteristics of
      eight sustained instrument sounds using a listening test.

      #元コメの3行目以降は「余計なもの」だと思う

      • by Anonymous Coward
        LAMEなんかで使われている心理音響モデルとはまた違う話なのかな。あれは感情への影響までは考えていないか。
    • by Anonymous Coward

      音質が低下するという確実だが雑な予想を定量的とはいえ計測したことに意味がある。
      新規性があるかは不明。既に同じような研究がされている可能性もあるので。

  • by Anonymous Coward on 2019年01月22日 21時43分 (#3552606)

    あと50年ぐらい経ったら、そのうなるような音が味があるとかで懐古的ブームになる。

    • by Anonymous Coward

      安物のプレーヤーで聞く、スクラッチノイズ入りのLPがブームになっているくらいですしね

    • by Anonymous Coward

      MP3がAACやmp4に取って代わられたのは「growl」やネガティブな印象のせい、、と言い出すやつが明日にも出てくると思う

    • by Anonymous Coward

      今でもアナログは温かみがあるとか言う人がいるから・・・
      個人的には単に自分が若いころに聞いた音源と似ているから懐かしさを感じてるだけだと思うんですがね。

      • by Anonymous Coward

        高域が適度に減衰してるほうが柔らかい音にはなるよ。
        データ上の再現性が高いほうが心地よい音と言うわけではない。

        高域をストレートに聞かせる場合は
        電源をしっかりしたものにしないと耳障り(耳に刺さる感じ)な音になる。
        スイッチング電源はスイッチングノイズが音に乗るからね。
        (あくまでアナログ音声信号の場合ね)
        ある程度高域の聴覚が維持できてる人じゃないと分からないけど。

        と最近N-30AEを買った自分が思い知ったところだよ……
        CDプレーヤーの変わりにしたかったのに聞き続けると耳が痛い。

        • by Anonymous Coward

          CDをリッピングして作ったファイルを再生させたら? (必要ならWAVで)

          あと、アンプやスピーカーは何を使っている?

  • by Anonymous Coward on 2019年01月22日 22時12分 (#3552630)

    高ビットレートでもリピートしてると無意識に忌避するようになって可逆に乗り換えたんですが、MP3ではそうなるもののAACでは(まだ)なってないので、MP3自体に欠陥があるんじゃないかと思っています。

    • by Anonymous Coward on 2019年01月22日 22時41分 (#3552646)

      mp3、デコード処理がマズくてデコード時にクリッピングしてる可能性もあるので、そこも疑うといいかも

      浮動小数点数で表現されてて-1.0~+1.0を超えるデータが普通にあるのに、-1.0~+1.0をそのまま16bit integerに割り当ててデコードしてる酷いプレイヤーが結構ある
      (クリッピングして波形が壊れた状態から音量調節してるので、プレイヤーの音量下げても無意味にクリッピングしちゃう)
      (正しくはfloatでデコードして音量調節してから16bit(等、DACとか目的にあわせた形式)にしないといけない)

      駄目なもの例えばWindows Media Player 12やWinampなんかがそういう酷いデコードしてる
      DAWのCakewalkやCubase(最新のはなおった?)のmp3インポート機能も同様正しく読み込めないで波形壊れる

      正しくデコードしてるプレイヤーをいくつか挙げるなら、foobar2000、VLC media player、KbMedia Player辺り(の最近のバージョン)ならだいじょうぶ

      親コメント
      • 浮動小数点数で表現されてて-1.0~+1.0を超えるデータが普通にあるのに、-1.0~+1.0をそのまま16bit integerに割り当ててデコードしてる酷いプレイヤーが結構ある

        ここら辺は、規格上どうなってるかはともかくとして、「酷いプレイヤー」の存在を前提にして、エンコード時に音量を下げた方がいいのではないかと。

        # True Peakで-1dBFSとかにね。

        親コメント
      • by Anonymous Coward

        Windowsのカーネルミキサーが、深く関係しているよね。
        WMPとかはカーネルミキサー通すから音質劣化がひどい。
        WASAPI排他モードに非対応だから、なおさらなんだよな。

        >foobar2000、VLC media player、KbMedia Player辺り(の最近のバージョン)ならだいじょうぶ
        VLCとかも、カーネルミキサー通さず再生する方法があるのか。
        foobarは、拡張機能を入れれば行けるとは聞いているけれど。

        • by Anonymous Coward on 2019年01月23日 15時33分 (#3553046)

          それもデコードがマズいって話と同様にプレイヤー側が正しく扱えていないという問題だったりします

          WASAPI共有モード、内部は32bit floatらしくて、単独の何らかのオーディオを流してループバック(※1)させてみるとわかるけど完全に元の精度を保っていて、超簡単に言うとミキサーを通しても音質は全く劣化しない

          (それだけで納得できる素直な人なら、この先は専門的な長文なので読まなくていいかも><;)

          よく言われるWASAPIは音が悪いというのは、ありぱぱさんが指摘した「リミッターの動作が雑であり、しかも 0 dBFSまで使わずに少し手前から効いてしまう」という話から生じた誤解かも(これですね [dgo.xsrv.jp] あとこれ [impress.co.jp]とか)

          じゃあどうすればいいのかというと、プレイヤー側で音量調節してからWASAPIに流してあげればよいわけで・・・
          すると、今度は例えば『それでは16bit精度では送れない』『(いわゆる)ビットパーフェクト(※2)にならないじゃないか』という誤解が発生するけど、WASAPIの内部の制度はかなりプロフェッショナル向けな構造になってるっぽくて、16bit精度のまま32bit floatにディザをかけずにアップコンバート(というかなんというか)してから音量調節して32bit floatでWASAPI共有に流してあげると、ミキサーを通った後にループバックしたデータを見るときれいに(32bit float精度の限界最大で)16bit精度でそのまま残っています

          なので、理屈の上では、例えば16bitソースを32bit floatに変換してからWASAPI共有に流して32bitのDACに送り込めば、16bitのビットパーフェクト再生と同等の再生が可能・・・なほどに高精度(※3)なので、Windowsが音が悪いというのは完全に誤解かも

          そして本題であるmp3の再生だけど、#3552646に書いたとおりmp3はそもそも-1.0~+1.0を超える表現が出来てしまい、もちろん理論上bitパーフェクトなんていう概念も基本的には無く、実際例えばamazon mp3で売ってるデータでも超えてるのが普通なので、そのまま音量調節せずに普通のDACに送り込めば(排他モードであっても)クリッピングを起こす
          つまりカーネルミキサーは音が悪いと誤解された原因と同じ現象をさらに悪化させたようなことが起きるので、もっと音が悪くなる
          (というか記録された波形とぜんぜん違う波形がDACに流れてしまう)

          なので、どっちにしてもmp3は正常な音声として鳴らすにはWASAPIに投げる前に音量調節が必要なので、その調節の時に十分にヘッドルームを空けていれば(※4)、WASAPI共有モードのミキサーは音質に全く影響をあたえないと言える

          なので、結論としては、WASAPI共有が音が悪いって話は、そもそもデジタル録音(の特に量子化)を理解してない(音の)エンジニアやソフトウェア開発者の勘違いと処理の手抜きの言い訳と言えるかも
          そしてWindowsのVista以降のオーディオシステムって、本格的にプロ向け(※5)な発想すぎて、一般人向けにはある意味オーバースペックなのかも(故にこんな誤解が出ちゃったのかも)

          ----

          (※1 Windows Core Audio(WASAPI)は柔軟なデザインなので、再生デバイスを録音デバイスのように扱うことで簡単にデジタルループバックができるようになってる)

          (※2 余談として、表現範囲と整数精度の量子化bit数の話で言うのであれば、半分で1bitだという当たり前の事を忘れずに考えるべきかも それを忘れて解像度の話をしてる人が当時結構居たかも)

          (※3 だけど、そこまでする意味はたぶん無いかも 数値として高精度であっても、人間が知覚するのは不可能だし、その違いが直接有意に現れるスピーカーやヘッドホンなんてもしあっても一般人は買えないだろうし、何よりもどうせDAC内部で1bit化してしまうので、世の中のほとんどのDACはそういう意味での真のbitパーフェクト再生(?)は出来ない(例えば「bitパーフェクト!」って言ってる人で実際にラダーDACをわざわざ使ってる人がどれだけ居るのかって考えるとなおさら) 結果的に音が知覚できるほどに変化する場合は、単にDAC側での処理がマズいと言えるかも(むしろディザ処理しないと逆に音質が悪化する可能性もある(けどそれも人間の耳じゃ判別無理そう)))

          (※4 他に音を出さないつもりなら、1dBFSでも十分かも(ありぱぱさんのおすすめは0.2dBFSのヘッドルーム。わたしのおすすめは3.0dBFSのヘッドルーム。それでも放送業界辺りの常識から見たら全然少なすぎ(音デカすぎ、余裕無くて危険)かも?))

          (※5 この文脈上のプロは、例えば放送業界とか信号処理とかそっち系であって、デジタル録音を理解せず日常的にクリッピングしてる楽曲データを作ってる音楽界隈の一部の馬鹿なエンジニアは含みません(有名人で駄目な人を一人挙げるなら、中田ヤスなんとかさんとか))

          親コメント
        • by Anonymous Coward

          foobar2000はコンポーネントでたいていの事はできるからな。
          WASAPI排他はもちろんASIOにも対応できるし、ASIOProxyかませればDSDをそのままDACへ送れる。
          試行錯誤な必要な事と、結構頻繁に落ちるのが難点かな。

    • by Anonymous Coward

      じゅうにぶんに現役

  • by Anonymous Coward on 2019年01月23日 2時38分 (#3552714)

    ダンスミュージックが得意なAレーベルがしばらく採用してたCDS-200
    PC環境では、データトラック側を聞きやがれってことになってたけど、
    やっぱりあからさまに、しゃりしゃりしゃりしゃりいうんだよな

    • by Anonymous Coward

      そんなの audacity あたりでスペクトル見ればすぐに確認できますよ
      一分もかからない

      • by Anonymous Coward

        Audacity で見るまでもなく、しゃりしゃりいってます。
        それが、ネガティブな印象を受けやすいかどうか。

  • by Anonymous Coward on 2019年01月23日 7時26分 (#3552737)

    32Kbpsで試してみてよw

typodupeerror

にわかな奴ほど語りたがる -- あるハッカー

読み込み中...