曲のサビを検出するアルゴリズム 137
ストーリー by Acanthopanax
サビをきかせて 部門より
サビをきかせて 部門より
igaiga 曰く、 "BioNewsFromNatureの記事によると、曲のサビをみつけてジャンプできる新しいプログラムを産業技術総合研究所の後藤真孝研究員が米国音響学会で発表した。 Celine Dionの「マイ・ハート・ウィル・ゴー・オン」や、Jon Bon Joviの「ユー・ギブ・ラブ・ア・バッド・ネーム」などのポピュラー音楽のヒット曲でサビからサビへとジャンプできることを実演したという。 このアルゴリズムは音程(ドレミ)ごとの強さを基に繰り返しを検出し、サビに相当する可能性が高い部分を選ぶ。 分析時間は4分の曲で約1分、また80%の曲でサビを正しく選び出した。 音楽を扱うアルゴリズムは自然科学などの分野に比べればまだまだ発展途上、面白いアルゴリズムが今後たくさん生まれてくるのかもしれない。"
他のジャンルだと?? (スコア:3, おもしろおかしい)
# みんな同じに聞こえる。
Re:他のジャンルだと?? (スコア:2, 参考になる)
Re:他のジャンルだと?? (スコア:2, おもしろおかしい)
えっ J-POP って検索するの 色々と [infoseek.co.jp] 大変そうな気がしますが:-p
コード進行だけで見る場合, Deep Purpleの『Burn』とBeethovenの『運命』と区別は出来るんでしょうかね, とお約束のことを言ってみたりして
Re:他のジャンルだとだめでしょうね (スコア:1, フレームのもと)
しかし、もっとも疑問なのは、そういうことがわかって、それでなにかいいことあるのか?って言うこと。音楽のサビってのは、サビでない部分があるからサビの部分が引き立つ。サビはサビ以外の部分も聞くからサビがサビたりえるわけで、音楽を楽しむ側からすると、サビだけ聞かされてもねぇ、と思うわけですし。
「産業技術総合研究所」でしょ?元工業技術院も混ざってる「経済産業省」系でしょ?この研究がどんな「産業と経済に良い影響を与えるか」を説明して欲しいなぁ。これで雇用が増えるのかな?この研究自体よりも、この研究がどんなふうに産業と経済に良い影響を与えるか、というアプリケーションを考える研究のほうが、よほどコストがかかるように思うわけなんですけどね。純粋な基礎研究そのものも含め、研究所全体としては、方向違う(=その研究員の給与は税金の無駄)、ってことないですかね?
この研究員は別の研究所に行ったほうが出世できるかも知れませんね。
Re:他のジャンルだとだめでしょうね (スコア:4, 参考になる)
去年国内で発表 [itmedia.co.jp]した時にエピソードとしてとりあげていましたが,某CDショップの試聴ブースでは客が早送りボタンを押してサビの頭出しをしているのを見て「だったらボタン1つでサビの頭出しができればいいのに」と思ったのがこの研究のモチベーションの1つのようです.普段,普通に音楽を楽しむための技術ではないような気がします.
産業面でのニーズとしては,サビの概念のある音楽に対するアノテーションをベースに,たとえば試聴システムの効率化などを睨んでいるのではないかと思います(えらい狭いニーズのような気もしなくはないですが……).エンドユーザにとってうれしい技術ではなさそう,というのが個人的な印象です.
# 個人的に試聴ブースにはPIONEER CDJ PLAYER [pioneer.co.jp]のようなジョグダイヤル式早送り・巻戻し導入希望.
Re:他のジャンルだとだめでしょうね (スコア:2, すばらしい洞察)
対象が日本の市場で支配力を持っている、「だいたい定型でサビを持つ」
音楽であることに、なにか問題でもあるんですか?前半と後半で矛盾してますよ。
「サビ抽出=サビだけ聞かされる」という短絡思考もすごい。この技術で、データ
ベースに格納されている各曲をサビ部分と非サビ部分に(分けられる曲は)分けて
特徴量計算などしておけば、「あの曲のタイトルなんだっけ?ほら、サビが
『はーんふぅーんへー』てな感じの曲」とかいう需要に対応できる可能性もある
のですよ。もちろんそんな曲ばかりではないとしても、8割の曲がこれで検出でき
るなら商売としてはそれで充分でしょ。
#タイプライターが発明されれば「なんだ筆記体は書けないのか。そもそもこれで
#署名はできない。無駄な発明だ」と言い、日本語ワープロが発明されれば
#「アラビア語の教科書を書くのには使えないね。#製作者は世界を知らなさすぎ
#る」と言うような反論ですよ。
Re:他のジャンルだとだめでしょうね (スコア:2, 参考になる)
一歩外に出たらその一歩でた先のものを解析できるアルゴリズムを作るればいい。技術的に応用ができる部分があれば、別の音楽を解析するアルゴリズムをを作るのもすこしは容易になるのでは?
#感情や感性の話と、技術論は今のところ分離して論じた方がいいですよ。たしかに混同しやすい話ですが。
#もしそこまで加味して完璧に解析できるアルゴリズムがあるなら……そのときはきっとそのコンピュータは人工知能をもっているでしょう;-P
また、使い方も、音楽のさびのデータベースなど、自動でできる、とか応用範囲はいくらでもあると思う。的中率が七割でもあれば、人間が分類するときの手助けになるでしょう。
今の機械翻訳ソフトと似たような感じでね。
追補 (スコア:1, すばらしい洞察)
# もちろんジョークですからあまりお気になさらないよう。
Re:他のジャンルだと?? (スコア:1)
サビどころか、音程まで無かったりして。
どの周波数領域を分析? (スコア:3, 興味深い)
あとは、特にJ-POPに関してなら、サビ前のお約束の一瞬のタメ(無音)も分析に活用すれば、精度の上昇が望めそうな気がします。
# 自分もおんなじようなことを研究してるつもりなのでID。
Your 金銭的 potential. Our passion - Micro$oft
Tsukitomo(月友)
Re:どの周波数領域を分析? (スコア:3, 参考になる)
だったらマスメディア報道でなく学会とか、 研究者が最初に、かつ詳細な発表をするところにアンテナを張ってないと。
文献によると、16kHzで4096点FFTして(中略)6オクターブぐらい足してますよ。
音高に意味があるようなので、 上の方のノイズ成分に当たるところだけ捨ててるかも。 人の声と楽器の音とは区別してないでしょう。
規格化 (スコア:2, おもしろおかしい)
錆に突入する前には、必ず大きく息を吸い込んで、無音の時間を作る。
他の楽器などの音が大きくて判別し辛い事を防ぐ為、吸い込む時の楽器の数を制限する。
更に、息を吸い込むのは、吸い込み音が聞こえる位激しく吸い込む。
例外が必要なら、必要に応じ協議の上てパターン化し、随時規格に登録する。
ただしむやみに追加しまくってはいけない。既存の規格内で出来るよう、極力努力する。
尚、これらは一括して、日本音楽著作権協会の100%子会社、
日本音楽サビ検出協会がとりまとめる事にする。これで権利料ががっぽがっぽ。
あまりに馬鹿馬鹿しいのでAC
スポーツ中継のダイジェスト (スコア:2, 興味深い)
歓声の大きさでダイジェストを自動で作るってのを何日か前にテレビで見た。
# スレ違い
Re:スポーツ中継のダイジェスト (スコア:1, 興味深い)
Re:スポーツ中継のダイジェスト (スコア:1)
Family Tiesや Caroline in N.Y. なんかの sitcom でも使えるか? と思ったんですが, 少し遅れて笑い声が入るときがあるので難しそうですね
音楽の楽しみ方 (スコア:2)
それに加えて、この曲のサビを見つけていただいちゃうとなると、3分の曲を30秒で聴いて、サビを繰り返し聴くだけでカラオケの練習ができちゃったりするんでしょう。通勤途中に友人の結婚披露宴で唄う歌の練習なんかもできますね(私はいやだ)。
そのうち、音楽配信にもこういう技術が使われていくんでしょうが、どうも音楽を聴くという行為を否定されているようで、いまひとつなじめないオヤジです。
nobuo * Who's gonna die first? *
Re:音楽の楽しみ方 (スコア:4, 興味深い)
という記述が面白いと感じました。私はPCで音楽を聞くようになってから、曲を自由にシークしてザッピング的に聞くことも増えました。
ある現代用語辞典のヘヴィーメタルというジャンルの音楽の説明に「ギターソロを聞かせる音楽」と有りまして、その直球な表現に感心した事が有ります。POPSは比較的サビは分かりやすいですが、サビを拡大解釈すれば音楽のエッセンスから何処が旨みであるか判断するのは大変難しいですね。
しかしこういった研究は興味深い反面、オートメーション化は寂しい感じもしますなぁ。
将来は応用的に半自動作曲など考えられるんでしょうね、抽象的な言葉で例えば「サビへの以降は雨上がりの様にに明るめに」など指定すれば自動的に沢山ある曲のパーツの中から候補が選ばれ人間が候補を選んで行くとか。
上記の場合マイナーからメジャーへの転調など、音楽理論を知らなくてもある程度の品質の音楽が誰でも作れる時代は来そうですね。
Re:音楽の楽しみ方 (スコア:1)
なんですと! と直球的に反応してしまいました.
決してそんなことはないと思いたいんだけど, ひょっとしたらそうかもしれません:-p
著作権と音楽の30秒引用 (スコア:2, 参考になる)
なぜなら、音楽の30秒以内の引用は黙認されているため、30秒ならある程度自由に配信できるからです。実際、カウントダウンTVや TSUTAYA の@試聴機はこれをうまく利用して音楽を紹介することに成功しています。
つまり、この技術がもし確立すれば、企業でなければできなかったこういったサービスが一般視聴者でもできるようになり、音楽の紹介方法の幅が広がりますから、そう悲観したものでもないのではないでしょうか。
参考:http://www.syuppan.net/mura_HP/uzu/uzu_401.html
Re:著作権と音楽の30秒引用 (スコア:3, 興味深い)
>なぜなら、音楽の30秒以内の引用は黙認されているため、30秒ならある程度自由に配信できるからです。
「黙認されている」って断言出来る状況とは思えないが....
あるレコードメーカーがツタヤ等に30秒以内ならば黙認しているからといって、それが全ての著作権者があたかも黙認しているか如く述べるのは問題では?
まして「30秒ならある程度自由に配信できる」なんて、「ある程度」とは断っているが何処に「自由に配信できる」なんて感じれるところがあるのだ?
>つまり、この技術がもし確立すれば、企業でなければできなかったこういったサービスが一般視聴者でもできるようになり、音楽の紹介方法の幅が広がりますから、そう悲観したものでもないのではないでしょうか。
「30秒ルール 音楽」でググれば分かると思うが、「著作権法上の引用に販売目的の一部分の視聴が含まれるのか?」と言うのがあり、その結果レコードメーカー等が黙認しているだけに過ぎない。
紹介目的で一般の企業や個人に30秒ルールが適用されるなんて話は聞いた事が無いです。
それは更に一歩踏み込んでいるのではないでしょうか?
例えば、CDを販売するwebサイトではCDのジャケットの画像を販売目的で引用する。
ジャケットを見て購入する奴も結構多いので、著作権の引用の条件に入っていると思う。
購入するには、どんな曲か聴かなければ分からない面がある。だから視聴させるってのはこれも微妙ではあるが引用の条件に入っている可能性が高い。
しかし、単なる紹介(記事)で、本当に曲の一部を提示する必要があるのかは、結構微妙なんじゃないの?
どんな曲か実際に聴かせて紹介したいとレコードメーカーが思っていれば、レコードメーカーのサイトにアップされていると考えるべきなんじゃ?
このさびの部分がどう良いかと言った論文でも書くのならば、本当にさびの部分だけを引用すればよく30秒も要らないでしょ。
30秒OKなんて言ったら、25秒程度毎に分割して個々に紹介の論文を書けば良いとか誤解する奴が出てくると思う。
「ある程度」がついても「自由に配信できる」なんて誤解を与えかねないのでは。
Re:著作権と音楽の30秒引用 (スコア:2, 参考になる)
A.30秒以内でも原則的に著作権侵害になります。 [chuo-u.ac.jp]や
一定の試聴が、許諾なしで利用できるケースが登場する可能性は十分ありますが、今のところは著作権法違反です。 [houtal.com]
と駄目そうですね。
やなぎ
字面じゃなく論旨を読もう。モデレートはそれからだ
Re:音楽の楽しみ方 (スコア:1)
単位時間当たりに多くの曲を聞けることになるので結果的に音楽自体は質があがるのではないでしょうか?
サビを聞いてから、全曲を聞くっていう行為そのものはCMやらドラマの主題歌が売れるってことと同義だと思います。
より多くのシグナルを得ようとするのは仕方ないことですかね。
と普段technoしか聞かないのにいってみたり。
試聴機だよ? (スコア:2, 興味深い)
タレコミがなぜかここにリンクしてないから、文化がどうこうとか明後日の方向にいくコメントが続出するんだと思う。
そうですか! (スコア:1)
# しかし、何年も研究費かけた結果がこれではサビしい。
Re:そうですか! (スコア:1)
「何年も」かけてはいないでしょ。 実作業時間としては、サビ区間検出の確立に半年かせいぜい1年(音情研での発表が2002年秋だな)、SmartMusicKioskなるUI作成に3ヶ月から半年くらい(インタラクション2003が2003年2月だな)じゃないかな。
それやってる間も並行して他の仕事もしてるだろうから それなりに膨らみはするだろうけど、でも、そのくらいだと思う。
で、少なくとも、最初の論文を書く直前にはシステムは完成しているというか、論文書く頃には研究は既に一段落しているわけ。 その後は、同じネタをあっちこっちに発表だけしているような感じだと思うよ。 その後も細かい改良はあるかもしれないけど、 本質的な進歩でなければそのために時間はかけない。
最初の発表のあとは研究としては今はまだ発表していない別のことをやっているんではないかな。
Re:そうみたいですね (スコア:1)
ちなみに Nature Web News の元記事は、
5月28日のSmart music system skips to chorus [nature.com]で、
アメリカの学会で発表されたので記事なったという事です。
「SmartMusicKIOSK: サビ出し機能付き音楽試聴機 [aist.go.jp]」自体は
2003年2月27日に情報処理学会で賞を受賞 [bmoon.jp]しています。
バーコード試聴機に活用してほしい (スコア:2, すばらしい洞察)
url (スコア:1, 参考になる)
結構前からやってるのね。
分析時間は4分の曲で約1分 (スコア:1)
ある曲の聞かせたい部分をサビとするなら、わたしらは聞きたい部分を聞いているのであって、聞かせたい部分を聞きたいわけではないと...
聞き方まで強制(矯正?)しようっていうのが、そもそも間違っている様に思えたりするわけです。
Re:分析時間は4分の曲で約1分 (スコア:1)
サビを聞きたい人向けにボタンを増やしただけで、 なにも普通に聞きたい人にまでサビだけ聞くのを強制しているわけじゃないんですが。
Re:分析時間は4分の曲で約1分 (スコア:1, 参考になる)
効率的に作ることで、ライブラリ「管理」の一助になるという考えで、
サビだけ聞きたい、サビだけで満足なんて「聞き方」は滅多にある
場面では無く、その用途を想定してボタンを増やした訳で無いかと。
プロモーションとして、新譜の聞き所だけしかウェブに置かないとか
CMで流さないなんてのは日常茶飯事で、小室哲哉氏などの逸話には
サビだけレコーディングしてCMで流してから他を作るとかありました。
元コメントの不満と言うのは、そういったサビを主軸にしたプロモで
人為的に達成されている事を、リスナーまでが喜んで迎合する事に
対するものでしょう。意図していない聞き所の、人為的統計的抽出の方が
名曲を評価するという文化的に正確な評価手法でしょう。
この技術は、楽曲に重みづけをするのではなく、コイン投げ程度の
気楽さで目安を割り出すだけのつもりでしょうから、的外れと言えば
的外れに違いないですけど。
Re:分析時間は4分の曲で約1分 (スコア:2, 興味深い)
私はちょっと違う見方をしています。
その手の、断片だけつまみ食いしてよしとするような人種は、断片を提供してくれる人がいなければそもそも小説なんぞに手を出さない人種であって、一方小説好きないしその予備軍は断片集には手を出さないし、というわけで棲み分けが起きて、もともと文化を支えていた層自体のサイズは変わらないんじゃないかと思います。
甘いですかね?
意外と否定的コメントが多いな…… (スコア:1)
私の場合、好みが激しく偏向している上に、どんな曲が気に入るか自分でもよくわからない(傾向的に好きなタイプのはずなのにNGだったり嫌いなはずなのに最上位ランクに喰い込んできたり)ので、こーゆーので片っ端から漁りたいですね。
あと、amazonなどCD販売サイトや音楽ダウンロード販売サイトでは最初の数十秒だけ試聴させてくれますが、「最初」ではイントロすら終わってない曲もよくあります。これじゃどんな曲だかさっぱりわからんことがほとんどなので、以前から「サビだけ聴かせてくれりゃいいのに」と思ってたんですが、そーゆーのにも適用できそうです。
amazonの利用者は多そうなので、特に後者については同じ意見の人も多いと思ったんですが……。
ワサビ (スコア:1)
まだまだそこまでは、技術が足りません。 もっと研究積み重ね。
ポピュラー音楽 (スコア:1)
Re:ポピュラー音楽 (スコア:1)
音楽業界で (スコア:1)
このアルゴリズムを「騙す」メロディーライン作りが流行ったりすれば、それはそれで面白いかも。
むらちより/あい/をこめて。
Re:判定して欲しい曲を挙げるスレ (スコア:2, おもしろおかしい)
Re:判定して欲しい曲を挙げるスレ (スコア:2, おもしろおかしい)
いまから判定されたサビの部分だけ演奏するので聴いていてくださいね♪
Re:判定して欲しい曲を挙げるスレ (スコア:1)
判定されました (スコア:2, おもしろおかしい)
# 画面が青くなってリセット。
Re:判定して欲しい曲を挙げるスレ (スコア:1, 興味深い)
Re:判定して欲しい曲を挙げるスレ (スコア:1)
いや、曲は幾つかあるが、そのうちのどれを選ぶかは問題じゃないのよ。
(俺が気になる)問題は、「作曲家様が」納得する判定をしてくれるかどうか?なので。
「サビ」っていう考え方自体が、1つの、創作(作曲)に対する「枠」なんだよね。
それを使いたいときもあるけど、ウザイから使いたくないときもある。
ま、規格化というジョークも有った通り、
作曲家の意図なんてものはどうでもいいと捉えることで、
商業を助けはするんだろうけど、
文化は助けないと思う。
#「どこをサビと言わず、すみずみまで聞いて欲しい」のでG7
#つまり解答は、何処をサビだと判定しても「不正解」なのよ(藁
Re:判定して欲しい曲を挙げるスレ (スコア:1)
やかましい音ネタにサビはあるのか?
メドレーで見せ場が複数、かつ曲のイメージが激しく変わるので客観的な判定は難しい?
本来サビがあってはいけないんですけどねぇ...(サビがあると乗客の気分が高揚してしまい、駆け込み乗車を助長する恐れがある)
Re:判定して欲しい曲を挙げるスレ (スコア:1)
山手線の新大久保のはサビそのままじゃん。
Re:判定して欲しい曲を挙げるスレ (スコア:1)
それ 高田馬場と勘違いしてません?
もしくは蒲田とか?
Re:判定して欲しい曲を挙げるスレ (スコア:1)
はい、実は聞いたことありません。ネタとして知ってるだけです。
多分聞きとおす根性ないし。
Re:判定して欲しい曲を挙げるスレ (スコア:1)
Re:判定して欲しい曲を挙げるスレ (スコア:1)
#あにきぃ…もうダメだっ
/* Kachou Utumi
I'm Not Rich... */
Re:で、なんで (スコア:1)
たぶん、タレコミストが大脳生理か認知心理かなんかをやっていて、 アンテナを張っていたのがそっち方面だけだからじゃないかな。 で、音響学会で発表があったので引っかかったと。