Microsoft、自分の声で26か国語を話せる翻訳こんにゃく技術を公開
Microsoft ResearchはTechFest 2012の基調講演で、テキストデータとして入力された文章を26か国語に翻訳、話し言葉として読み上げる通訳技術デモを公開した。(本家/.、technology review、ExtreamTech記事、Engadget Japanese)。
このデモのポイントとしては、音声入力したユーザーのアクセントや声色、イントネーションを維持した上で、その音声を再構成する形で26か国語に翻訳してしまうこと。つまりドラえもんの秘密道具「翻訳こんにゃく」のように、音声入力者がネイティブで26か国語が話せる技術に一歩近づいたと言える。
デモでは長めの英語の文章を入力し、それをイタリア語やスペイン語、北京語などに翻訳してみせている。この技術は同社のクラウドプラットフォーム「Windows Azure」とリンクしているため、通常の翻訳ソフトのようにいちいち言語や変換のクセを学習させる必要はない。
さらにこのデモでは、Webカメラで撮影した映像から3Dモデルと表情のテクスチャを自動生成するアバターを作り、話すときの顔も再現してみせた。この技術が実用化されれば、将来的にはスマートフォンで海外の人と話すと、ほぼリアルタイムで通話を翻訳して会話のできる時代が来る……といいなあ。