aitoの日記: 3/12 日本音響学会春季研究発表会 音楽音響SS
第5会場 スペシャルセッション 音楽音響 [音楽音響と音楽関連産業]
午前-前半(9:15~10:30)[音楽音響と音楽関連産業II] 座長 三浦 雅展 副座長 安井 希子
3-5-1 (招待講演)音楽情報検索の現状および音楽産業への展開について ○帆足 啓一郎(KDDI研究所)
音楽検索関連研究の「失敗」の紹介。
・2000年代前半ぐらいに開始(それまではテキスト検索だったが、Googleの出現で終了)
・「にたうた検索」
手持ちのMP3と似た楽曲を検索する
Query-by-Example、適合フィードバックによる個人嗜好適応
実験サイトでの公開→本格採用に至らず
ユーザニーズとの乖離
未知の楽曲を探す、という行動をユーザがするのか?
特定の楽曲を探すなら厳密検索の方が適切
検索プロセスが面倒だった
「結局、検索は一つの機能に過ぎない」「検索は楽しくない」→技術だけでサービスが実現できるという勘違い
・音楽検索から「音楽の発見・活用」へ
まぜうた(にたうた検索+自動リミックス(ビート合わせ))
・楽曲スライドショー
楽曲の歌詞印象に適した画像を検索→スライドショー
歌詞の行から画像検索をして並べる
そのままやると変になるので、画像全体のキーワードと行ごとのキーワードを併用
・今後の展開?
Context-basedな音楽検索・再生(ドラえもんの「ムードもりあげ楽団」)
・まとめ
研究テーマのアウトプットは明確に考えるべき
ピボットを恐れずにやるべき
3-5-2 (招待講演)歌声分析のエンターテイメント応用:音楽検索からカラオケまで ○伊藤 彰則(東北大学)
私の発表。前半はこれまでやってきたハミング・歌声検索について。
後半では最初にカラオケの歴史と、もっとも古いカラオケ採点関係の特許、カラオケ関係の面白特許など。
3-5-3 擬音語音声入力による効果音検索システム ☆渡邉 智之,相川 清明(東京工科大)
擬音語による効果音データベースの検索。効果音にあらかじめ擬音語を付けておき、音声の認識結果とDPマッチングで対応を付けて検索する。新しくないような気が・・・実験の結果、試行の2/3で目的の効果音が見つかった。
午前-後半(10:45~11:45)[音楽音響と音楽関連産業III] 座長 西村 明 副座長 江村 伯夫
3-5-4 2次元LRパーサによる音楽演奏MIDI信号からの自動採譜 ☆高宗 典玄,亀岡 弘和(東大院情報理工),嵯峨山 茂樹(東大院情報理工 / 現:国立情報学研究所)
MIDIを楽譜にする。楽譜を2次元PCFGで表現し、テンポ変動を状態遷移モデルで表現したうえ、組み合わせて生成モデルを作る。2次元PCFGは、音符を時間方向と和音方向に分割していくモデル。テンポについては、複数のテンポを異なる状態で表現し、テンポが似ているほど遷移確率を高くする。パージングは富田パーサを2次元に拡張したもの。そのために、複数の音高に対するスタックを並列に用意して、複数のスタックに対するshift-reduceが同期するようにしなければいけないので結構めんどくさそう。入力に対して複数のテンポを仮定しながらパージングを行い、スコアでビームサーチをしながら候補を絞り込んでいく。
3-5-5 音楽音響信号に含まれる調波音の周波数特性とドラムの音色の転写システム ☆中村 友彦(東大院・情報理工),吉井 和佳,後藤 真孝(産総研),亀岡 弘和(東大院・情報理工)
任意の(ポピュラー音楽の)打楽器の音を、別な音楽に含まれる別な打楽器の音に挿げ替える。最初にスペクトログラムから調波音と打楽器音を分離し、打楽器音を楽器ごとに分離したうえで別な打楽器音にすげかえる。挿げ替える方法として、単にコピーする方法と、イコライズによって音色を似せる方法を検討。コピーする方法では、楽器分離で使ったNMFのアクティベーションを対応付ける方法を使う。全体としてはコピーした方が評価が高いが、イコライザの音が好きな人もいる。
3-5-6 混合音楽信号の正弦波・残差モデルを用いた再生速度変換の検討 ☆五十嵐 佑樹(東北大院),伊藤 仁(東北工大),能勢 隆,伊藤 彰則(東北大院)
うちの研究室の五十嵐君。音楽信号を正弦波成分+雑音成分に分け、雑音成分をLPC分析したうえで、アタックの部分以外を伸び縮みさせることで、楽器の時間的構造を変えないで再生速度を変える。話はわかりやすかったと思うが発表が長すぎ。
3-5-7 調波時間因子分解に基づく音楽事前情報付き多重音解析 ☆四方 紘太郎(東大・工),高宗 典玄,中村 友彦(東大院・情報理工),亀岡 弘和(東大院・情報理工/NTT CS研)
新たな多重音解析手法「調波時間因子分解」を提案。特殊なウェーブレット変換(HTCと類似な結果を得る)とNMFに類似の規定・アクティベーション分解を使う。F0推定を含み、ビブラートなどのF0変動を扱うことができる。また、調推定結果を使ってスペクトルの分布関数の事前分布を調整することによって精度を上げる。
3/12 日本音響学会春季研究発表会 音楽音響SS More ログイン