aitoの日記: 3月9日 音響学会音声Aスペシャルセッション「ロボットと音声対話システム」
13:30 音声Aスペシャルセッション
会話ロボットとそのプロトコル(小林哲則,早稲田大学)
・会話ロボットの系譜.WABOTからERICAまで
・ロボットのための音声対話 vs. 音声対話のためのロボット
会話相手としての存在感,内部状態表出,会話プロトコルを合わせる手段
・人と生活空間を共有するロボットの会話
さまざまなプロトコルによって人間と「通信」している
・データリンク/ネットワーク
通信チャネルの確立(姿勢・視線による通信相手の表現=参与構造の形成)
SCHEMAの多人数会話デモ
・トランスポート
End-to-endの通信管理・エラー処理
パラ言語認識に基づくインクリメンタルな情報伝達
ROBISUKEのパラ言語認識デモ
パラ言語により「受信されなかった」ことを認識したら情報を詳細化・再送する
あるいは「条件に合う検索結果がない」ということをパラ言語的に表出
リアクティブな計画修正に基づくプロアクティブな情報提供
対話的な新聞記事の情報提供
・セッション
ターンテイキング
視線によるメッセージ終了タイミングの通知
・アプリケーション
具体的な通信サービス 例:ファシリテーション会話(システムを含む4人で会話)
「おいてけぼり」を救うため,会話に割って入って話していない人に話題を振る
会話に入ってイニシアティブを取るためのプロトコル
談話構造・発話権の管理 POMDPなども使う
雑談対話システムにおける言語処理技術(東中竜一郎,NTT)
・現状の対話システムで使われている言語処理技術について紹介
・雑談対話システム
雑談は人間社会を形成する.人間の会話の60%は雑談
雑談が実現するもの:信頼感,愛着,嗜好,思考喚起,承認
タスク指向型対話システムの満足度向上
タスク指向の対話でもユーザは雑談をしてしまう
・システム作成の方法論
ルールベース(ELIZA型)
抽出ベース:たとえばTwitterのリプライ検索に基づく方法など
理解・生成に基づく方法
昔のタスク指向システムをオープンドメインに拡張
会話理論を組み込みやすい
・理解生成に基づく方法の課題
汎用的な発話理解・生成・管理が必要
汎用的な対話行為セット,述語項構造による発話の分析・生成
データに基づく発話候補のランキング
ユーザ情報の記憶,個性の演出
・汎用的発話行為33種類
・述語項構造解析
ゼロ代名詞の照応解析も行う
隠れたガ格の推定精度は約55%
・ユーザ情報記憶
34種類の人物属性,推定精度89%
・述語項構造に基づく生成
・キャラクタ風発話変換
・発話ランキング:複数の候補から適切な発話を選ぶ
文脈との意味類似度,人間同士のコーパスとの類似度,対話破綻確率などからDNNで学習
・システムエラーと対話破綻
解釈不能な発話,質問を無視するなど
・問題点
音声合成の問題,質問文が理解できない,レスポンスの問題,マルチモーダル理解
人と自然に対話できる自律型アンドロイドの開発(港隆史・石黒浩,ATR/大阪大学)
・石黒共生ヒューマンロボットインタラクションプロジェクト
・自律型音声対話アンドロイド研究開発のためのプラットフォームERICA
・ノンバーバル情報の認識(マイクロフォンアレイ),動作生成
・アンドロイド制御システム,インタラクション設計支援システム
・高度な対話感がある対話 感情・意図の表出
・自然な対話のために
動作・振る舞いが人間と同じではない→動作の意図や理由が解釈できない
インタラクションを通した人の適応
アンドロイドに急速に適応させるための要因を明らかにする
(人間の自然な動作とは異なる,より効果的な動作をさせる)
・発話時の自然な頭部動作生成
ロボット自身が発話しているという感覚を持たせる
人間の動作をコピーするよりもモデルで首の動きを生成した方が自然性が高い
・対話意欲を引き起こす対話戦略
アンドロイドの発話の意図を感じさせる:コンテキスト破綻,対話意欲の減退を防ぐ
意図・価値観を組み込んだ発話生成モデル
対話において「肯定(=親和性)」と「否定(=独自の価値観)」のバランスをとる
「価値観の所有感」と「親和性」を同時に最大化するピークは肯定割合50%t100%の間にありそう
(有意な差は無い)
3月9日 音響学会音声Aスペシャルセッション「ロボットと音声対話システム」 More ログイン