aitoの日記: 音楽情報科学研究会@金沢 1日目(8/9)まとめ
市場の4階みたいなところが会場でちょっと迷う。ニコ生のテストが直前までできなくてぶっつけ本番的スタート。
○Songrium:多様な関係性に基づく音楽視聴支援サービス(産総研)
濱崎さん。つい先日サービスインしたばかりのsongrium.jp のお話。VOCALOID楽曲のつながりを元に2次元の可視化をして、つながりに基づいて楽曲を視聴・発見できる。ニコニコ動画への楽曲と2次創作投稿数が等加速度的に増えているという話がすごい。タグを「作品」だけでなく「作品間の関係」に振りましょうというのが提案。「関係性」をユーザ参加的にタグ付けするところが本質か。星空に似せた2次元の可視化がかっこいい。
○VOCALOID楽曲の評価法及び推薦法(静岡県立大学)
VOCALOIDランキングサイト「ボカロノビス」の管理者。本業は修士2年でデータマイニングとかやってるらしい。楽曲の人気上位・下位の楽曲の差が開いているが、その原因の一つにランキングがある。従来のランキング手法によってユーザ視聴動画の多様性が失われてしまうので、ランキング方法を根本的に変えるべきという主張。提案法ではマイリスト数とマイリスト率だけを使う。スコアリング法はアドホックだが、何かの一般化ができるといいと思う。
○統計的言語モデルを用いた作詞補助システムのための歌詞特徴に関する検討(東北大)
当研究室の阿部さんが発表。ニコ生がトラブルで開始が遅れる。結局Ustreamだけで中継。これまで提案していた作詞補助システムに実際の歌詞データを利用して、通常テキストによるモデルとの違いを調べた。また、ピアプロの歌詞データを使った歌詞生成。質問にはうまく答えられていたと思う。
○モスキート音に基づく電子透かしを用いた歌詞連動型音楽視聴システムの提案(立命館大)
森勢さん。聞こえにくい高音域に情報を載せる電子透かし。アプリケーションとしては、音楽にメタ情報を載せて、音楽信号からその曲の情報を検索する。通信速度は約230bps。信号送信を表す制御ビットを2ビット設けて交互に送信することでパケット境界を明確にするというアイデアはおもしろい。通信技術的にはまだナイーブかなという印象。
○VocaListenerによる学習データ生成を利用した多対多固有声変換に基づく歌声声質変換(奈良先端)
歌声の声質変換。暑苦しい発表。多対多固有声変換を基本とするが、モデルを作成するためにピボットとなる歌唱者が必要で、その歌唱者がすべてのほかの歌唱者と同じ曲を歌ったパラレルコーパスが必要なので、それをVocaListenerで生成する。うまいアイデアだ。実験結果では、学習と合成に異なる曲を使った場合の性能は従来法よりも高い。
○声質空間上での変換に基づく歌声らしさの転写に関する検討(東大)
SLPでは保護者だったのにMUSでは自分で発表している齋藤さん。歌声の声質変換技術を使って、ある人の話声を元にして、その人の(別な言語内容の)歌声を作る。話者の固有空間上で「歌声」と「話声」の差分を作り、それを別な人の「話声」に加えることで、空間上のその人の歌声の点を推定する。主観評価の結果、歌声と話声の差分が大きい場合には変換の効果が現れることがわかった。
○歌声・音声分析合成のためのF0適応多重フレーム統合分析に基づくスペクトル包絡と群遅延の推定法(産総研)
中野さん。音声の高品質な分析合成。ピッチ同期スペクトル分析に加えて、近傍のフレームの分析結果を使って平滑化することで包絡を安定に推定する。群遅延についても似たようなテクニックを使う。スペクトルの最大包絡に対応する群遅延を最終結果として推定する。
スペシャルセッション「音楽情報処理と機械学習」
吉井さんオーガナイズ。パネリストは大石さん、戸田先生、亀岡さん、中野(允裕)さん。
・最初に吉井さんが音楽情報処理における機械学習の概略の説明。
・戸田先生。音声の確率モデル。合成・変換の場合には、確率モデルから時系列データに戻す技術が必要になるが、動的特徴量を考慮することで性能が上がった。系列内変動を考慮した音声生成法。固有声変換の着想と紹介。声質コントローラ。複数フレーム統合のスペクトル分析。
・大石さん。歌声の中にある音楽以外の情報:「うまさ」(意識的)や「らしさ」(無意識的)に注目。「歌声と話声の違い」(ΔF0のGMMによるモデル化)「音高の動き」(相空間によるF0軌跡表現とGMMによるモデル化)「F0軌跡の生成過程」(藤崎モデルの確率モデル化)について。
・亀岡さん。人間と同様に音メディアを理解できるシステムの実現。音の生成モデルからの逆問題。多重音解析、調波・打楽器音分解、音声(イントネーション、歌い回し)の分析。生成モデルによる統一的な問題の定式化。最後に補助関数法について熱い思いを語る。
・中野さん。ノンパラメトリックベイズ法。ノンパラメトリックベイズ法についてサーベイ。様々な確率過程と、モデルの構造化法の掛け合わせによって様々な手法が作れる。チューニングなしに高精度な楽音分離が可能。
音楽情報科学研究会@金沢 1日目(8/9)まとめ More ログイン