パスワードを忘れた? アカウント作成
13464296 journal
日記

aitoの日記: 11/25 SIGMUS@日大まとめ

日記 by aito

■楽器 [11:00-12:00]
(1) 手回しオルゴールの魅力と脳波的考察
   関 妹子,志賀 一雅
最初に手回しオルゴールの紹介。今回利用しているのはカード式。福祉施設での音楽療法(聞くことではなく,ハンドルを回して演奏することによる),保育園や美術館などでの演奏活動。カードを作るワークショップなども開いている。好評なので,手回しオルゴールの音に癒し効果があるのか調べた。効果の計測は脳波によるが,脳波の説明は嘘とは言えないがやや怪しい。脳波の計測には脳力開発研究所というところが作っているアルファテック7という機器を使っているが,これ怪しくないのかなあ。参考文献にはバイオフィードバック学会と日本サイ科学会の論文が並んでいる。演奏の実演では「こんぺいとうの踊り」の演奏を行った。オルゴールは素敵な音色。

13390883 journal
日記

aitoの日記: 8月26日 SIGMUS夏シンポ3日目まとめ

日記 by aito

8月26日(土)
■分析 [9:00-10:30}
(19)作曲者判定タスクのために分析すべき楽曲の長さ
   高本 綺架,吉田 光男,梅村 恭司,市川 裕子
このグループでは、データ圧縮効率によって作曲者を当てるという手法を試している。前回は既存のデータ圧縮ツールを使っていたが、今回は自前でデータ圧縮を行う。提案手法はMultigram言語モデルみたいな方法で、ピアノロール×16分音符の2次元に発音しているかどうかの0/1パターンを作り、それを連結した1次元データから辞書を作って圧縮する。辞書作成の時に何個の音まで利用するかを調べたところ、連続する2音まで使うとほとんどのデータに対して正解することができる。多分各時刻の発音パターンを符号化して符号の分布を考えるのと似たことをしていて、そちらの方が性能が高くなる気がする(いずれにしても、このタスクは簡単なので何を使っても性能は高いだろう)。

13390454 journal
日記

aitoの日記: 8月25日 SIGMUS夏シンポ2日目まとめ

日記 by aito

8月25日(金)
■演奏支援 [9:00-10:30]
(7) グラウンデッド・セオリー・アプローチ的方法によるピアノ演奏習得におけるチャンク形成要因の予備分析
   石垣 愛美,竹川 佳成,平田 圭二,冨永 敦子
楽譜のまとまり(チャンク)が学習者の認知としてどのように形成されるのかを、Grounded Theory Approach (GTA)という理論に沿って分析する。ピアノ曲を題材に、直接演奏する場合と、楽譜と音楽を視聴するだけの場合でチャンクの獲得過程を比較。これを実験して分析するの大変だったろうなあ。分析を通して、チャンクを「譜面チャンク」「演奏チャンク」「音楽知識チャンク」の3つの大分類に分類。音楽を何回か演奏または視聴することで、どの分類のチャンクの比率がどの程度あるのかを分析した。経験者と初心者で傾向が違うが、演奏を行わないで楽譜を視聴するだけだと演奏に関するチャンクが形成されないという傾向があった。

13389782 journal
日記

aitoの日記: 8月24日 SIGMUS夏シンポ1日目まとめ

日記 by aito

8月24日(木)
■アプリケーション・歌唱支援 [13:00-15:00]
(1) 背景音楽のテンポが休息時の作業者に与える効果:生理的指標の評価
   村上 昌志,坂本 隆,加藤 俊一
作業後の休息時間中に音楽を聞かせる場合に、音楽のテンポが休息効果にどう影響するかをしらべた。被験者にTOEICの模擬テストをやらせたあと、同じピアノ曲を60/120/180BPMの3条件で聞かせ、心拍の揺らぎのLF/HF比(ストレス指標)を測った。その結果、音楽がないよりもあったほうがよく、BPMが小さいほうがストレス指標が下がった(ストレス解消効果が高い)。ストレス解消効果があるBPMの下限はどこかという質問が出た。今回はピアノ曲なので、BPMが大きい方が全体のパワーが大きくてラウドネスが大きい(かもしれない)ことが影響しているのではないかとコメントした。

13380075 journal
日記

aitoの日記: IIH-MSP2017@松江 3日目

日記 by aito

2017/08/15

Session C01: Massive Image/Video Compression and Transmission for Emerging Networks
このセッションでは座長が来られなかったのでPan先生が座長をやる。

Extraction of EEG Components Based on Time-frequency Blind Source Separation (Xue-Ying Zhang et al)
No Show.

13379922 journal
日記

aitoの日記: IIH-MSP2017@松江 2日目

日記 by aito

2017/08/14

Keynote Speech II
Flexible, Personalized and Expressive Speech Synthesis Based on Statistical Approaches
Prof. Takashi Nose
Tohoku University, Japan
能勢先生による音声合成技術のレクチャー。
・音声合成のさまざまなアプリケーション。音声対話システム、オーディオブック、歌声合成、ゲームなど
・TTSのさまざまな種類。単語置換、ダイフォン、ユニット選択、統計ベース
・統計的音声合成の概要
・音声のパラメータ化(音声→スペクトル+F0→音声)
・HMMとDNNによる合成の

13378876 journal
日記

aitoの日記: IIH-MSP2017@松江 1日目

日記 by aito

2017/08/13

Keynote Speech I
Cryo-ET Data Processing and Bio-Macromolecule 3-D Reconstruction
Zhiyong Liu
The Institute of Computing Technology, CAS
クライオ電子顕微鏡による高分子構造の分析。
・最初に高分子分析のさまざまな話。X線結晶分析との違いなど。
・クライオ電子トモグラフィの原理。原理自体は普通のトモグラフィと同じ。
 3次元構造を2次元に射影するプロセス(光線方向への線積分)を行列の積で表して解く
・問題点
        低いSNR
 

13289317 journal
日記

aitoの日記: 5/22-23 EMM&IT研究会@米沢まとめ

日記 by aito

5/22-23 EMM&IT研究会@米沢

5/22(月)

(1) JavaScript難読化手法jjencodeを用いたプログラムへのデータ埋め込みの一方法(京大)
日置先生。JavaScriptを難読化し、その難読化過程に情報を埋める。難読化ツールとしてjjencodeを使う。jjencodeはJavaScriptのコードを非英数字のみに変換する方法。難読化の過程に冗長性があるので、そこに情報を埋める。jjencodeの仕組みの解説があったが、これはトリッキーだ。情報の埋め込みは、文字生成の方法(型変換を使う、文字リテラル(8進数、16進数、ユニコード)、変数を使う)の冗長性を利用する。この方法により、1文字が24倍ぐらいになる。データ埋め込み率2%(スクリプトの2%程度を埋め込みに使える)。

13180422 journal
日記

aitoの日記: 2017/3/7 EMM研究会@宮古島 2日目

日記 by aito

3月7日(火) 午前? 一般 座長:薗田 光太郎(長崎大) 09:25 - 10:40
(13) 09:25-09:50
PDCAサイクルに基づく健康メディアに対するセルフケア法の提案
○千種康民・山崎祥行(東京工科大)
個人の健康管理をPDCAサイクルの手法でやりましょうと言う提案。事例紹介などもあったのだが、PDCAサイクルのおかげなのかどうか判然としない。

13180419 journal
日記

aitoの日記: 2017/3/6 EMM研究会@宮古島 1日目

日記 by aito

(1) 14:30-15:30
[ポスター講演]KAZE特徴量を導入した電子透かし法の検討
○深田有花・川村正樹(山口大)
KAZEで特徴点を求め、特徴点の周りに(特徴点によって決まるスケールで)透かしを埋め込む。透かしの中にマーカ情報を入れ、取り出しがどの程度うまく行っているかを推定し、最終的に複数の特徴点から取り出した透かしで多数決を行う。SIFTより(スケーリング変換以外は)頑健。

(2) 14:30-15:30
[ポスター講演]多元LDPC符号を用いた電子透かし法とJPEG圧縮に対する評価
○佐伯豊彦・野崎隆之・川村正樹(山口大)
GF(2^m)を利用するLDPC。従来研究ではmが大きいときは性能が高くなったので、JPEGへの電子透かしに応用してみたが、GF(2)の場合よりよくならなかった。

13173417 journal
日記

aitoの日記: 2017/2/28 音楽情報科学研究会2日目

日記 by aito

2月28日(火)

■音楽音響分析[9:00-10:30]
(10)ソプラノ歌手の歌声における母音知覚—基本周波数および声楽経験の影響—
   遠藤 希美,川原 繁人,皆川 泰代
音声の基本周波数が高くなると母音の聴き取りは悪くなるが、それに聴取者の声楽経験がどう関係するのかを調べた。440Hzと880Hzでは880Hzのほうが聴き取りは悪いが、声楽経験の有無による効果はまちまち。声楽経験がある方が反応時間は長い。

(11)ニューラルネットワークによる楽器の音色の識別
   山田 雅之,守田 了
楽器音のスペクトルから基本周波数を求め、基本周波数成分と倍音成分とのパワー比を4ビットに量子化した2進パターンを入力としてNNを学習。使用データは少ない。なんでこんな方法を使うのか理解できない。

13172698 journal
日記

aitoの日記: 2017/2/27 音楽情報科学研究会1日目

日記 by aito

■演奏・歌唱支援[13:00-14:10]
(1) 独奏認識誤りに頑健な音響入力伴奏システム
   足立 亜里紗,堀内 靖雄,黒岩 眞吾
自動伴奏のための音符認識で、同じ音高の音符が連続する場合の問題。検出漏れ・過検出の場合に、演奏者がおおむね伴奏に合わせて演奏しているという仮定の下で演奏が破たんしないようにする。演奏者の音符が来るべき時間から前後に信頼度を設定し、それを使って未検出の音符を仮定したり検出した音符を無視したりする。

12872996 journal
日記

aitoの日記: 2016/8/9-10 EA研・聴覚研@東北学院大多賀城キャンパス

日記 by aito

8月9日(火) 午後
座長: 島内 末廣 (NTT)
13:00 - 14:30
(1) 客観尺度を単語候補間で比較する二者択一型了解度推定方法の検討 ○近藤和弘(山形大)
二者択一型の単語了解度主観評価(DRT)に対応する客観評価手法の改良。試験用単語対セットを用意し、どちらかの単語の劣化した奴をクリーンな2つの候補単語をそれぞれサブバンドに分けて、サブバンドごとに重み付きで距離を求める。正しい単語間の距離が誤り単語間の距離より大きいかどうかで値を±1に振り分けてサブバンドについて集計。従来の(PESQより良いとされる)客観評価法よりも種環境価値と高い相関を示す。

12870269 journal
日記

aitoの日記: 2016年7月30日~31日 MUS研究会@東京理科大野田キャンパス

日記 by aito

7月30日 音楽情報科学研究会@東京理科大 野田キャンパス

13:30~ 音楽分析
(1) SMF解析による楽曲の難易度判定(木更津高専)
間に合わなくて途中から。MIDIからピアノ曲の演奏の難しさを推定する手法のようだが、すべてヒューリスティックなのでいろいろ突っ込まれていた。

(2) 平均情報量からみたクラシックギター国際コンクールの自由曲の特徴分析(東海大)
コンクールで使われた曲の分析。最初に人気曲の作曲家の分布などを年代別に分析。また音高・音名・音価それぞれについて、古い作品よりも新しい作品の方がエントロピーが大きい。

12870263 journal
日記

aitoの日記: 2016年7月28日~29日 SP/SLP研究会@天童温泉

日記 by aito

7月28日(木)

■音響モデル・適応化(14:00-15:30)

(SP-1) 英語レベル連結DNN音響モデルを用いた日本人英語音声認識の評価
      ○河内祐太,政瀧浩和,浅見太一,青野裕司(NTT)
非ネイティブ(日本人)英語発話の認識。GMM-HMMではMAP適応などが使えるが、DNN-HMMだとうまく適応できないので、ネイティブ性を表す特徴量を作ってそれをネットワークに入れる。具体的にはフレームごとに言語を判別するニューラルネットを作って、そのボトルネック層出力を認識用DNNの入力とする。ネイティブ性の識別に寄与するのは子音ではr,v,fなど、母音ではei,ouなど。1ポイントぐらい改善。

typodupeerror

UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie

読み込み中...