NTT主導のロスレス音声圧縮技術「MPEG-4 ALS」が承認される 75
ストーリー by Acanthopanax
権利関係もクリア 部門より
権利関係もクリア 部門より
maia曰く、"12月27日NTTの発表によれば、NTT主導で開発したロスレス音声圧縮技術がMPEG標準規格「MPEG-4 ALS」として承認された(ニュースリリース)。MPEG-4 ALS(Audio Lossless)は、NTTが提案した多くの要素技術を元に共同開発されていた。ロスレス技術として世界一の圧縮性能と処理の高速性を両立させたとされるが、重要なのは特許権利関係がクリアな国際標準であること。具体的には未定だが、関連技術を持ついくつかの団体—ベルリン工科大学・米RealNetworks・I2R(シンガポール国立情報通信研究所)等—と共に、関連特許を任意団体による特許プールで管理し、ライセンスを行なう予定(AV Watch記事)。対応する入力は、サンプリング周波数最大192kHz、量子化数32bit(整数PCMフォーマット)、浮動小数点符号化IEEE 754 32bit浮動小数点対応、チャネル数最大65536など(ASCII24記事)。なおNTTは標準に準拠しつつ、さらに高速なデコーダを独自開発している。"
音楽配信とか (スコア:5, 参考になる)
高ビットレートなMP3並みですね。
# iTMSでもロスレス販売するなら、プロプライエタリで50%程度の
# 圧縮率しかもたない AppleLossless よりこっちにしてほしいかも。
# あ、iPodも対応しないといけないけどアップデータで対応できるかな?
Re:音楽配信とか (スコア:3, おもしろおかしい)
>高ビットレートなMP3並みですね。
15%まで圧縮できるのは「4'33"」だけです
その他のふつ~の音楽は70%前後となります。
だったりして。
Re:音楽配信とか (スコア:3, おもしろおかしい)
ヒースキット山口 heath yamaguchi
Re:音楽配信とか (スコア:1)
written by こうふう
Re:音楽配信とか (スコア:1)
つ[Wikipedia [wikipedia.org]]
Re:音楽配信とか (スコア:0)
真面目に録音すれば必ず入るはずのノイズは残ってるの?
完全無音のネタファイルで 15% だったら非力すぎ。
Re:音楽配信とか (スコア:1, 参考になる)
楽章の合間でピアノの蓋を閉じる+楽譜を閉じる+次の楽章の楽譜を開く+ピアノの蓋を開ける
という動作があるので、ライブでもスタジオでも無音ということはない。
Re:音楽配信とか (スコア:1)
試していませんが、ZIPだと25%もいかないように予想。
Re:音楽配信とか (スコア:3, 参考になる)
Re:音楽配信とか (スコア:5, 参考になる)
フリーソフトが2本あるので、圧縮率の低い方がflac、高い方がMonkey's
Audioではないかと。
ただ、個人的には「lossless圧縮だと、圧縮の優劣を競っても高々3,4%
しか違わない。展開速度だけみるなら、flacとMPEG4-ALSは同等」と読めて
しまう。「圧縮率ではMonkey's Audioに勝り、展開速度ではflacと同等」
と言いたいのだと思いますが。
#どっちもトップクラスなのは確かですね。
Re:音楽配信とか (スコア:1)
>展開速度ではflacと同等
じゃなくて「展開速度ではflacと同等以上」です。
Re:音楽配信とか (スコア:1)
NTTのも出たら、是非足してもらえれば、ずいぶん参考になると思いますね。
というか、性能もですが、最後にはソフトの対応が結構一番重要かと。
Re:音楽配信とか (スコア:2, 興味深い)
wikipedia [wikipedia.org]より
> この曲は、いわゆる「無」を聞くものと言うよりも、演奏会場外のさまざまな雑音、
> すなわち、鳥の声、木々の揺れる音、会場のざわめきなどをきくものとされている。
> コンサートの余韻を大事にするために、この作品をアンコールで取上げる演奏者もいる。
Re:音楽配信とか (スコア:1, 興味深い)
「CD上での4''33'の完全なカバー」をすでに発表しています。
もちろん再生環境での環境音を聴くのが前提です。
ちなみに同カバーの「リミックス」も存在します。
Re:音楽配信とか (スコア:1)
プロトコル(案)
- 量子化32ビットとし、上位16ビットは 0x0000、下位16ビットに任意データを「漉き込む」。
- 4''33' で足りなければサンプリングレートを上げる。余る場合は 0x0000 で埋める。
- MPEG-4 ALSでエンコードし、タイトルを「4''33'」にする。
- これだけだと巷に「4''33'」というデータが溢れかえるので、漉き込まれたデータを識別
する情報も合わせて漉き込む。(このフォーマットについては別のプロトコルで定める)
- なんか言われたら「環境音です。遠くの方で誰か音を鳴らしていたようで…」
273sec(=4''33') x 192kHz x 2byte まで任意データを格納可能なコンテナ完成。
ばんじゃーい! ∩(・∀・)∩
Re:音楽配信とか (スコア:3, 参考になる)
15%になるのは非常に特殊な条件だと思われます.(44.1kHz/48kHzで録音したものを後で192kHzにサンプリング周波数変換したデータを対象にした場合など)
原理的にロスレス圧縮は圧縮率を上げられないので,過大な期待はしないで下さい.
個人的には大したメリットが無いのでロスレス圧縮する必用などほとんど無いと思います.
(それ以上にサンプリング周波数192kHzなど無意味)
Re:音楽配信とか (スコア:3, 参考になる)
> 192kHzの高いサンプリング周波数で、かつ静かなクラシックなどの曲の場合20%まで圧縮できる。
とあるので、圧縮率についてはそうなのでしょう。
もう一方の論点の、ロスレス圧縮についての必要性については、ケースバイケースではないで
しょうか。
個人的には、通常の音楽ソースのリスニングではロスレスである必要性は全くないと思います。
(160kbpsMP3だともうソースと聴き比べても違いが分からん…)
が、ロスレスだと安心感はありますよね。なにより、「どこまで圧縮すれば聴感上の違いなしに
サイズを縮められるだろう」という点について悩まなくて済む、という点は大きいかと。
それと、学術用途ではロスレスでないと困りそうな分野はありそう。…と思ってソースを見ると、
> 脳磁場の波形データなど多チャンネルで高サンプリングレートのものでは15%程度になると思われる
とありますから、まさしくこういう分野では有効でしょう。
# このあたりを読むと、チャンネル間の相関も利用しているようですね。
Re:音楽配信とか (スコア:1)
ですね。劣化しないので、他のコーデックを使って変換して、戻したり、代々劣化しないのでlosslessは良いと思います。
エンコードの際に、あーだこーだと設定で悩むことも少ないですし、CPUに関しては、全然losslessの方が、優しいし。
あと、元のCDを復元しようと思えば、できるのも、ある意味CDをそのままハードディスクに保管してるような安心感も得られると思います。100%物理的な復元は、難しいと思いますが。
Re:音楽配信とか (スコア:2, 興味深い)
演奏時間のほぼ全てに音が鳴り続けているロックやポップスならば
あなたの言うとおりサンプリングレートも低くていいし、確かに可逆圧縮はかかりにくいでしょうけれど、
クラッシック音楽ならば、たとえば無伴奏バイオリンならばサンプリングレートは高いほうがいいでしょうし、
無音部分があるから圧縮もしっかりかかるでしょう。
無意味とはあんまりでは。
オープンソースで使えるの? (スコア:2, 興味深い)
Re:オープンソースで使えるの? (スコア:4, 参考になる)
オープンソフトウェア/フリーソフトに近い形で使うことも検討範囲に入っている。
と答えているので、期待できるかも。
Re:オープンソースで使えるの? (スコア:2, すばらしい洞察)
1.「競合技術との圧縮性能比較」スライドの説明で、「上が高圧縮率」とありますが逆
2.「MPEGで国際標準規格として承認されたことにより特許関係がクリア」とだけありますが、実際は、少なくともMPEG参加団体が所有する特許に対して抵触可否がはっきりしているだけで、そういった調査がまったくされていないフリーソフトよりはマシという程度(MPEGに参加していない団体が特許を持っている可能性は否定できない。AV Watchの記事の最後の方にもサブマリン特許の可能性が少ないと書いてあり、逆にいうとサブマリンの可能性は0ではない)
3.NTTのプレスリリースにもAV Watchの記事にも有償での提供という話はあるが「オープン/フリーソフトに近い形で使うことも検討」という記載は無い。オープン/フリーソフトに近い形=無償を指すのであれば、標準化には莫大なお金がかかっており、今のNTTおよびNTT基礎研が置かれている状況を考えれば無償は無い?もし無償を視野に入れているならプレスリリースにその旨ありそうなものですが。QuickTimeのようにデコーダをフリーで配って、エンコーダで儲けるという話?
4.特許技術を持つ数社として「ベルリン工科大学/米リアルネットワークス(RealNetworks)社/I2R(シンガポール国立情報通信研究所)」をあげているが、NTTのプレスリリースにもAV Watchの記事にも、これらの団体は方式作成に強力したが「特許を所持している」とは記載されていない
Re:オープンソースで使えるの? (スコア:0)
Re:オープンソースで使えるの? (スコア:0)
# ソフトウェア特許制度が無い国で開発すると云う手もあるか。
Re:TwinVQ (スコア:1, 参考になる)
ヒント: iTunes Music Store
Re:TwinVQ (スコア:0)
Re:TwinVQ (スコア:1, 興味深い)
Re:TwinVQ (スコア:1, 参考になる)
何に対してどういう指標で勝てないんでしょ?例えばoggとwmaを比較した場合、圧縮率は知りませんが、シェアでoggが勝ったという話は一度たりとも聞いたことが無いのですが。
Re:TwinVQ (スコア:1, おもしろおかしい)
スラドでの人気
Re:TwinVQ (スコア:0)
アプリケーションが採用するという話でないの?
「実装」と書いてあるし。
Re:TwinVQ (スコア:1, すばらしい洞察)
最初からそういう話だと思ってますよ。さらに言えば、エンコーダよりは再生環境での採用率が重要でしょうね。
フリーソフトに限定すればoggはそれなりの採用率かもしれませんが、そういう特殊な条件でのシェアを気にしてるのは、フリーソフトの世界に生きてる人間だけでしょう。しかも、フリーの再生ソフトでも「oggに対応しているが、wmaには非対応」というソフトは非常に少ないんじゃないかと思いますが。
さらに、一般的な商用ソフトやデバイスにおける採用率を基準に考えた場合はoggの惨敗ですよね。例えばsonyですらウォークマンがWMAの直接再生に対応 [impress.co.jp]し始めていますが、oggなんて全く話題に上がりませんね。
最初の「オープンソースな実装じゃないと勝てない」という発言は(FUDとすら呼べない)単なるデマとしか思えませんし、そういう何でもかんでも無条件に「オープンソースにしろ」って言って喜んでるバカは、逆にオープンソース推進の妨げになっていることに早く気づくべきかと。
Re:TwinVQ (スコア:3, 参考になる)
1.データはユーザーなどが用意
2.データもアプリケーション配布側が用意
1の用途ではoggは惨敗ですが、2の用途では健闘してるようです。
…ま、エロゲとかのBGMや音声ファイルとかなんだけどw
エロゲに限らず、ゲームでのogg採用率は高い気がします。
ユーザーから見えない部分なので、気が付くことは少ないと思うけどね。
ゲームソフト組み込みなどでは、ライセンスフリーなのが重要なんでしょう。
※オープンソースなのも有用だと思うけど、ライセンスフリーという方がより重要。
Re:TwinVQ (スコア:2, 興味深い)
エロゲでは結構見るようになりましたね。
でも音声部分は喘ぎ声までoggになってるゲームもあったりして、普通に聞けちゃうというのが・・・(笑)
せめてアーカイブ位しとけと。
>エロゲに限らず、ゲームでのogg採用率は高い気がします。
こちらでは有名なのはやはりFalcom [falcom.co.jp]でしょうか。イースVIでoggが使われているのには驚きました。
これ以降のソフトも(Falcomが開発してるものは)oggですよね。
最初こそただogg使ってるよーって感じでしたが、最近のヤツに関しては
・曲名がちゃんとタグに書き込まれてある
・曲の終わり方がサントラ版と違う事もある
(サントラ版は2回ループ後フェードアウトが多いが、ogg版は曲を終わらせてる)
※でもゲーム中は上手くループするよう工夫してある
と、作ってるほうも「ファイル単体でも聞いてみてくれ」ってな作り方してますよね。
#それはともかく近年のイース関連はSSTPとか台詞変えるとかの濃い遊びが多いよなぁ
Re:TwinVQ (スコア:1)
> これ以降のソフトも(Falcomが開発してるものは)oggですよね。
他のソフトは知らないのですが、
先日購入したXANADU NEXT [falcom.com]は ogg ではありませんでした。
拡張子は.dec だったかな。中を覗くと「RIFF」で始まるのですが、WAVでもAVIでもありません。
ファルコム好きーの同僚によると、ぐるみんあたりから、ogg ではなくこの形式になってるとか。
Re:TwinVQ (スコア:3, 参考になる)
>例えばsonyですらウォークマンがWMAの直接再生に対応 [impress.co.jp]し始めていますが、
>oggなんて全く話題に上がりませんね。
結局、wma/mp3をワンチップでデコードするデコーダは安く供給されているけど、ogg対応のものは殆どないと言うだけだと思いますけどね。
実際、5・6,000円で売ってる中国製のUSBメモリ兼用のポケットプレーヤでもwmaとmp3には対応していてogg非対応と言う状況な訳だし、oggはそれなりにデコードであっても資源喰いますから…
デコーダチップの資源的な制約とか量産数の差でogg対応のものが高くつくのでogg対応までは普及していないのではないかな。と思いますけど。
Re:TwinVQ (スコア:1, 参考になる)
MP3デコーダは最低50,000USドル(=600万円弱)を支払わなくてはならないらしいので、ゲームメーカーがこぞってOgg Vorbisを採用するのは当たり前のような気がします。エンコーダーの方はもっと恐ろしい金額になるでしょう。
参考
Royality Rate [mp3licensing.com]
この手の物は後発が不利(Re:TwinVQ) (スコア:1)
・MP3がライセンスがあやふやにされている内にデファクトスタンダードになった
・WMPなどの普及でWMAがデファクトスタンダードになりかけている(Windowsに限り)
と言う状況があって、現在(ネットで)流通している音楽ファイルの大半がMP3かWMAだから、デコーダを売る側もライセンス料金の何倍も儲かる。ってだけではないかと…
Ogg Vorbisは後発な上に、既にMP3がデファクトスタンダードだった状況からの出発だったからデコーダを売る側も商売に旨味を感じない場合が多い→更に標準から遠のく…と言う負のスパイラルにはまってるだけだと思いますよ。
韓国製のプレーヤに対応する物があると言うことは、逆にいえば韓国では音楽ファイルのシェアとしてそれなりの地位をOgg Vorbisが占めていると考えた方がいいのでは?
# お国が違えばシェアも違う :-)
Re:TwinVQ (スコア:2, 参考になる)
参考:http://www.iriver.co.jp/community/column.php?ETC2,community,23 [iriver.co.jp]
Re:TwinVQ (スコア:1)
今は亡きRio KarmaもOgg Vorbis対応でしたね。
参考:Rio Karma 20GB Player [rioaudio.jp]
mp3を、WinとMac環境でまたがって使っているとタグの文字化けに悩まされますが、Ogg Vorbisならそういうこともないので愛用していました(過去形)。
Re:TwinVQ (スコア:1)
>シェアを気にしてるのは、フリーソフトの世界に生きてる人間だけでしょう。
普通のヒトは商用ソフトとフリーウェアの両方を使うと思いますが?
フリーウェアでのシェアがなぜ「特殊」なのか良く分かりません。
>しかも、フリーの再生ソフトでも「oggに対応しているが、wmaには非対応」というソフトは
>非常に少ないんじゃないかと思いますが。
VLC、XMMS、Xineなどなど、普通に非対応ですね。
>さらに、一般的な商用ソフトやデバイスにおける採用率を基準に考えた場合はoggの惨敗ですよね。
>例えばsonyですらウォークマンがWMAの直接再生に対応 [impress.co.jp]し始めていますが、
>oggなんて全く話題に上がりませんね。
ソニーの場合、重要なのは「コピーコントロールが可能かどうか」ですな。
これが出来ない形式は、プロプラ、オプソ問わずにアウトでしょう。
>最初の「オープンソースな実装じゃないと勝てない」という発言は(FUDとすら呼べない)
>単なるデマとしか思えませんし、そういう何でもかんでも無条件に「オープンソースにしろ」って
>言って喜んでるバカは、逆にオープンソース推進の妨げになっていることに早く気づくべきかと。
結局、オプソ界を罵倒したいだけなんでしょ?無理に理由をこじつけなくてもいいですよ。
Re:TwinVQ (スコア:1, すばらしい洞察)
>これが出来ない形式は、プロプラ、オプソ問わずにアウトでしょう。
MP3ってコピーコントロールできましたっけ?
Re:TwinVQ (スコア:1, 参考になる)
ライブラリモジュール(Windows及びLinux)の配布(非商用)だけではダメですか?
Cマガジンで昔特集組んでました。
#自分、XMMS+SVQ decoderで音楽生活な人、ですから
Re:TwinVQ (スコア:1, 興味深い)
# あと、ライブラリだけ公開されてもほかのCPU(=デバイス)で対応する余地が無いので全く意味が無い
その点、この技術はMPEGに承認されたってことはコードは少なくとも出るし、多チャンネルロスレスはそれなりに需要があるから、あとはライセンスをスッキリさせてTTAみたいな位置を狙えるか(TTAはすでにハードウェアプレーヤの存在するオープンソースなロスレスCODEC)。
もっとも、TwinVQもMPEGに承認されてるわけで、MPEGに承認されたからといって流行るかどうかは微妙なところ。ただ(現段階では)TwinVQより需要のある技術なのは確か。
Re:TwinVQ (スコア:1)
へぇ。RioやCowonがflacサポートしているのは聞いていましたが、
ttaもハードウェアありですか。すんませんが、具体的にメーカ名と
製品を教えてもらえませんか?
#購入検討の対象にしたい。
Re:TwinVQ (スコア:1)
Re:TwinVQ (スコア:1)
ないだろうし、輸送費は多寡はしれてるしと。
#さすがに購入検討の対象外かな。スペック的には面白そうではありますが。
ライブラリ公開 (スコア:1)
エンジンをバーチャルマシンの仮想コードで配布してくれるといいかもね。
Re:TwinVQ (スコア:1)
May the source be with you... always.
Re:TwinVQ (スコア:1, 参考になる)
iRiver製品が置いてあるためでしょうが、意外な所で目撃したな、という感じです。
まぁ一般人は気にも留めないでしょうから、認知されてるとは言い難いでしょうけどね。
Re:TwinVQ (スコア:1)
一般的にはPacked PCMと呼ばれているはずです。