パスワードを忘れた? アカウント作成
13390883 journal
日記

aitoの日記: 8月26日 SIGMUS夏シンポ3日目まとめ

日記 by aito

8月26日(土)
■分析 [9:00-10:30}
(19)作曲者判定タスクのために分析すべき楽曲の長さ
   高本 綺架,吉田 光男,梅村 恭司,市川 裕子
このグループでは、データ圧縮効率によって作曲者を当てるという手法を試している。前回は既存のデータ圧縮ツールを使っていたが、今回は自前でデータ圧縮を行う。提案手法はMultigram言語モデルみたいな方法で、ピアノロール×16分音符の2次元に発音しているかどうかの0/1パターンを作り、それを連結した1次元データから辞書を作って圧縮する。辞書作成の時に何個の音まで利用するかを調べたところ、連続する2音まで使うとほとんどのデータに対して正解することができる。多分各時刻の発音パターンを符号化して符号の分布を考えるのと似たことをしていて、そちらの方が性能が高くなる気がする(いずれにしても、このタスクは簡単なので何を使っても性能は高いだろう)。

(20)多重ラベル分類を用いた意外性を有する楽曲検索・推薦手法の実験的考察
   大久保 好章,原口 誠,劉 赫宇
楽曲検索で、楽曲には音響情報とユーザによるタグ(ラベル)情報がついていると仮定した場合、クエリとして楽曲を与え、それに音楽的には似ているがラベル情報は必ずしも似ていない検索結果集合を求める方法。クエリにはラベルがついていないので、まずクエリについているであろうラベルを推定する。次に推定されたラベルから遠くてクエリには近い楽曲集合を求める。実際にはクエリのラベルを直接求めるのではなく、ラベルの空間を1次元にした空間への写像を求めて、1次元(直線)上で遠い楽曲を持ってくる。実験対象はMillion Song Datasetのベンチマークセットから24万曲。まだ実験を始めたところで結果は例だけ。

(21)TextTimeline: 文字表示を保持した発話テキストの音響特徴可視化
   中野 倫靖,加藤 淳,後藤 真孝
音声の特徴を反映して文字を表示する可視化方式。歌詞を横方向に表示し、音節ごとに音ゲーのように縦方向の長さが継続時間に比例したブロックが流れてくるデザイン。このデザインになるまでのサーベイやデザインポリシーの説明がとてもわかりやすかった。

■音楽データ [10:45-11:45]
(22)楽譜記述言語MusicXMLの拡張による楽典を考慮した和声解析フレームワークの提案
   清水 祐輔,沼尾 雅之
和声の解析をする際に、(筆者らの)これまでの研究では楽典の知識を使っていなかったので、楽典に沿った解釈によって和声解析をするためのフレームワークを作成した。拍節構造を考慮した構成音収集、楽典による解釈付与、和音の候補付与、候補の絞り込み、記譜などをフレームワーク上で行うことができる。楽典解釈の付与の部分ではいきなり実装の説明があって妥当性がよくわからない。また、処理とそのためのデータ構造のXML表現の両方が出てくるのだが、XML表現(MusicXMLの拡張)の提案とそれを処理する処理系の提案を同時に行っているということだろうか。

(23)ピアニストの演奏解釈を記述した演奏表情データベースの構築
   橋田 光代,兼口 敦音,中村 栄太,古屋 晋一,小川 容子,片寄 晴弘
これまで集めていたピアノ曲の表情データベースCrestMusePEDBを増強する話。PEDB 2nd versionではピアノのプロ奏者がMIDIピアノで演奏した曲を収録するほか、演奏者の解釈情報も収録し、全部で400弱の演奏を収録する予定。解釈は演奏者の主観に基づくので、アノテーションとXML化するのはたぶん人力なので大変そう。さまざまな「解釈の違い」による演奏の違いのデモがあった。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond

読み込み中...