aitoの日記: 2012/3/7 情報処理学会全国大会2日目
1日目は用があって東京.明日は朝から仙台に戻って来週の音響学会の発表練習をする予定.
学生セッション[3S会場]作曲・編曲
3S-1 ユーザの意図を考慮した、旋律への自動コードネーム付与システム
○千布佳菜子,久保田光一(中大)
メロディへのコード付与。参考にする複数の曲から統計を取り、それに似たメロディを付与する。コードを直接付与するのではなく、tonic/dominant/subdominantの基本コードを介している。基本コードと実際のコードの対応はユニグラム。生成方法が単純なのも問題だが、合成したい曲と似たコードを持つ曲を参考曲として入力する方法では、コード生成確率のスパースネスが問題になるので、あまり良い方法ではないと思った。
3S-2 聴感による演奏表情の評価特性の分析
○柴崎正浩(芝浦工大),鈴木泰山(ピコラボ),徳永幸生(芝浦工大),杉山 精(東京工芸大)
Kagurame Phase-IIIを作っているグループ。演奏表情の主観評価について。テンポ、強弱、発音長の知覚の相互関係を調査した。評価方法はScheffeの一対比較。「テンポ」と「強弱」の知覚に関連があるというのは面白かった。総合評価への影響はテンポが一番強い。この論文が学生奨励賞。
3S-3 旋律の演奏特徴量を反映させた作曲支援のための自動伴奏生成
○宮田佳奈,酒向慎司,北村 正(名工大)
伴奏生成。メロディは自分で与え、そこからコードをルールベースで付与。ヴォイシングはDPで決定する。入力したメロディにおける音符の長さ、ダイナミクスなどに応じて伴奏の音符長さや和音の音数などを変化させる。また、実際のジャズ演奏と和音構成を比較。7割ぐらい当たっている。入力メロディの表情に応じて伴奏の表情を変えるというアイデアは面白いが、作曲支援として本当に有効かどうか疑問。どういう伴奏をつけてほしいかによってメロディの表情を変えるような本末転倒なことが起きるのではないか。
3S-4 狭帯域雑音を利用した音楽の作成
○三井太介,阿部友実,橋本周司(早大)
狭帯域雑音を音源として使うための研究。帯域幅とピッチ知覚の測定からやっているところが面白い。帯域幅1/3octではピッチ知覚のばらつきが半音を越える。また、帯域幅と音色の関係をSD法で評価。帯域幅の変化による印象の変化はあまり安定しておらず、評価の妥当性に疑問が残る。
3S-5 リアルタイムで共同作曲ができるWebアプリの開発
○藤澤 伸,服部隆志(慶大)
作曲を共同でリアルタイムに行うWebアプリ。複数の人が、一つの曲の自分のパートを編集できて、その部分がリアルタイムに書き変わる。具体的にどういう形で作業が進んでいくのか想像ができなかった。
3S-6 Sound Mosaic Musicの作成ツールの開発とその評価
○武井 祥,徳永幸生(芝浦工大),杉山 精(東京工芸大),阿部匡伸(岡山大)
環境音を使って音楽を作るツール。犬猫の鳴き声を並べて曲にするのだが、いろいろな検討をしている割には実装が単純っぽい。特に複雑な信号処理をしている様子はない。どのような曲なら曲らしく聞こえるかどうかの調査など。主観評価に基づき、Sound Mosaic Musicとしてうまく聞こえる曲のガイドラインを作成した。
3S-7 対話型遺伝的アルゴリズムを用いたメロディに対する伴奏生成システム
○亀浦 駿,長名優子(東京工科大)
対話的進化計算で伴奏にユーザの好みを反映させる。コード生成はルールベースで決め、そこからの伴奏をGAで決める。伴奏のタイプをあらかじめいくつか決めておき、それに沿った形で伴奏を生成する。どの伴奏タイプがよいかは人間が評価する。GAで決めるべき部分が少ない気がした。GAを使わずに自分で伴奏パターンを選んでもそれほど違わないんじゃなかろうか。
3S-8 遺伝的アルゴリズムとNグラムモデルを用いた曲の構成を考慮した自動作曲システム
○高野美央,長名優子(東京工科大)
曲のリズムやメロディの進行をtrigramで表現。学習データをイントロ、サビなどに分類して、別なモデルを学習する。尤度の大きいメロディをGAで探索。初期音楽はマルコフモデルから生成する。生成された音楽は「世界で一つだけの花」に激似(そこから学習したのだろう)。元の音楽の生成がマルコフモデルなら、最尤な曲を探索するのはDPでよくて、GAを使う必然性がないように思った。
3S-9 実空間の情報を用いた背景音楽の自動生成
○高橋弦太,笹岡久行(旭川高専)
場面に対してBGMをつけるために、場面の色分布と距離分布から音楽を生成する。画像と距離の取得にはKinectを使う。画像の明るさや色合い、エッジの量、距離情報などを、テンポや曲調などの音楽パラメータに対応づける。場所のパラメータから音楽パラメータへの変換の妥当性には疑問が残る。実環境上のどのような情報を利用するのがよいのかについて質問が集中したが、そういうレベルの話ではない気がした。
3S-10 ピアノ譜のコード進行に基づいた合唱譜の自動編曲手法
○黒住夏美,伊藤克亘(法大)
J-POPのピアノ譜から合唱譜を自動生成する。主旋律をパートに割り当て、ほかのパートの効果(ハーモニー、スキャット、ユニゾンなど)を決定する。その上で旋律を生成し、譜割を行って楽譜を生成する。メロディ生成では、和声にあった音のうち、出現頻度が高く、対位法で矛盾しないものをDPで選択。市販の合唱譜とは一致しない音符が多いようだが、それが悪いのかどうかはよくわからない。
音楽認識・推定 座長 大石 康智(NTT)
4S-1 合成音への表現力付与のための擦弦楽器の発想伝達関数の推定
○小泉悠馬,伊藤克亘(法大)
バイオリン楽譜の発想記号(奏法)のモデル化。バイオリンの物理モデルを、ヘルムホルツ振動と奏法による影響(発想伝達関数)に分解する。音源としてモデルから生成される16種類の三角波+ノイズを使い、これにバイオリンの伝達関数を畳み込んで、観測信号とフィッティングすることで発想伝達関数を推定する。面白いが、時間構造を模擬するところまで行ってないところが問題か。
4S-2 統計的言語モデルを用いた作詞補助システムにおける単語アクセントの導入
○阿部ちひろ,伊藤彰則(東北大)
あべち(@abechi_smile)による発表。作詞補助システムに、アクセントの制約を入れましたという発表。学習データと提示される候補の関係についての質問があった。
(ここで抜けたので中略)
4S-7 倍音コーパスを用いた初期値依存性の低い多重基本周波数推定法
○阪上大地,糸山克寿,尾形哲也,奥乃 博(京大)
Latent Harmonic Allocationによる多重音のピッチ分析。LHAは初期値依存性が高いので、初期値に依存しにくい方法を確立する。基本アイデアは、適当な複数の調波構造の結合(凸包)で目的の音の調波構造が表現できると仮定し、凸包をMIDI音源から推定する。推定結果に制約を入れることで初期値による異常な推定結果が排除できると解釈した。
4S-8 フォルマントの変動を用いたビブラート検出法の提案
○榎 真吾,波多野賢治(同志社大)
カラオケ採点のためのビブラート抽出の高精度化。ビブラートの誤検出を防ぐため、フォルマント周波数によってビブラートを検出する。フォルマントはLPCで抽出。それにしても「腹筋しながら君が代」「ジャンプしながら君が代」って・・・。従来法では変な姿勢で歌唱したときのF0変動をビブラートと誤検出するが、提案法ではそのような誤検出を抑制することができた。
システム評価 座長 櫻庭 健年(日立)
4ZJ-3 ドライビングシミュレータを用いたジレンマゾーンにおけるドライバーの視線データの計測とその評価
○平野優輝,千田一誠,杉野栄二,瀬川典久,澤本 潤(岩手県大)
運転者の視線方向の調査。ジレンマゾーンは、黄信号で止まるか進むか悩む領域のことだそうだ。信号が黄色になった場合には信号をみる割合が増え、左右を見る割合が減る。当然な結果のようにも思えるが、定量的に測ったことに意味があるのかな。
4ZJ-4 日本語のやさしさの自動推定のための特徴量に関する基礎的検討
○張萌,伊藤彰則(東北大),佐藤和之(弘前大)
当研究室の張さんの発表。中国人による日本語文の理解度の自動推定。琉球大の當間先生(@naltoma)からご質問いただいた。理解されるだけでなく、誤解がない文章をどう作るかについては難しい課題と思う。
4ZJ-5 小型共焦点顕微鏡の開発
○平野俊幸,山田貴哉,服部公央亮,田口 亮(名工大),柴田 進(ミュースカイネット),保黒政大(中部大),堀米秀嘉(ホーリーマイン),梅崎太造(名工大)
生体組織内部が観察できる共焦点レーザ顕微鏡を作ってみた。レーザ光の走査にMEMSを使うことで、従来のミラー(モータ駆動)よりも小型・安価に作れるらしい。
2012/3/7 情報処理学会全国大会2日目 More ログイン