パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Google、音声コーデックLyraをオープンソース化。低いビットレートでも高音質」記事へのコメント

  • by Anonymous Coward

    世界で初めて音声を量子化して通信したSIGSALYが1500bpsだったそうだから、3kbpsは驚くほどビットレートが低いわけじゃないな。

    SIGSALY
    https://ja.wikipedia.org/wiki/SIGSALY [wikipedia.org]

    • by Anonymous Coward

      フロッピー1枚に「ローマの休日」が入るのだから、今の動画はもっと圧縮できるだろ、ぐらい不思議な発言
      音質(クリアに聞き取れるか)の観点がスッポリ抜けている

      • by Anonymous Coward

        初期のコーデックでは人が聴こえないデータを削ってギリギリまで容量減らしたのに、それから人間の耳が進化したわけでもないのにこれ以上容量や音質増やす必要あるのか?
        オーディオ系のオカルト並みに意味ないことやってる

        • by Anonymous Coward

          減らせるのは「聞こえないデータ」だけじゃないし。
          ブロックサイズを大きくして圧縮効率を高めたり、今ではAIで推測補完できる範囲も見込んでデータ減らせる。

          あと、特に通話向けの非可逆圧縮では「聞こえるけど影響が少ないって判断したデータ」も削除してるので、
          普通に聞いても音質が劣化してる。

          • by Anonymous Coward

            > AIで推測補完できる範囲も見込んで
            あまりイメージがわかないんだけど、再生にAIが必要ってこと?

            • by Anonymous Coward on 2021年04月10日 5時19分 (#4010437)

              データを受信してからゼロから学習する訳ではないので。
              何をAIと見なすかは人によりけりだが、
              再生に「何か特別」なものが必要という話ではない。

              あと1対多の放送・配信用途だと、エンコードの負荷を大きくして
              デコードの負荷を小さくするという戦略が有効だけど
              少数グループでの双方向通話ではあまり意味をなさない。
              なので、再生だけでなく録音側もベースラインは同様なはず。

              親コメント
              • by Anonymous Coward

                再生機の補正技術とかを計算の範囲に入れて「補正された後に出る音」を目的に別の音をAIで作る技術もあるしね。

                あと圧縮とはちょっと違うが「ニセレゾ」とか呼ばれてる音源は、過去の録音技術で失われる成分を学習して補完してる。

アレゲはアレゲを呼ぶ -- ある傍観者

処理中...