パスワードを忘れた? アカウント作成
240444 journal

aitoの日記: 2010年7月24日(土)SP&SLP研究会まとめ 午前前半

日記 by aito
[09:00-10:15] 音響モデル (座長:小川 哲司)

(SLP12) トップダウン及びボトムアップ手法に基づく音韻HMMのクラスタリング
関西学院の川端先生のところ.通常のトップダウン状態クラスタリングだけでなく,さらにボトムアップクラスタリングの結果も加える.トップダウンとボトムアップの結果を合わせて,ボトムアップクラスタにある音韻環境はボトムアップの結果を採用する.どの状態を共有するか等について検討.この手の研究って昔ずいぶんやってたよなあ.

(SLP13) An Evaluation of Discriminative Training for Hidden Markov Models in a Real-Environment Speech-Oriented Guidance System
奈良先端の鹿野研のDenis Babani.HMMの識別学習の効果をたけまるシステムで検証.MMI学習の対立候補生成のために使う言語モデル(unigram vs. bigram),言語重みなどのパラメータを変えて実験.最終的に,ML学習よりも2%ぐらい改善.まあそうだよね,という感じ.

(SLP14) KL情報量によるAnchor modelの階層的クラスタリングに基づく話者認識
同志社大の山本誠一先生のところ.アンカーモデルによる話者認識.アンカーモデルに使う話者は冗長なので,音響的に似たモデルをクラスタリングによりまとめる.距離尺度はKL情報量.GMM間のKL情報量を計算するために,2つのGMMの分布ごとの対応を求め,対応する分布間のKL情報量の総和をGMM間のKL情報量の近似値とする.クラスタ間距離はnearest-neighbor.BIC(単一ガウス仮定)によるクラスタリングよりもほのかに改善.質疑を西田先生が激フォロー.
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie

読み込み中...