Microsoft、自分の声で26か国語を話せる「翻訳こんにゃく」的技術を公開 30
ストーリー by hylom
さすがに食べられはしませんが 部門より
さすがに食べられはしませんが 部門より
taraiok 曰く、
Microsoft ResearchはTechFest 2012の基調講演で、テキストデータとして入力された文章を26か国語に翻訳、話し言葉として読み上げる通訳技術デモを公開した(本家/.、technology review、ExtreamTech記事、Engadget Japanese)。
このデモのポイントとしては、音声入力したユーザーのアクセントや声色、イントネーションを維持した上で、その音声を再構成する形で26か国語に翻訳してしまうこと。つまりドラえもんの秘密道具「翻訳こんにゃく」のように、音声入力者がネイティブで26か国語が話せる技術に一歩近づいたと言える。
デモでは長めの英語の文章を入力し、それをイタリア語やスペイン語、北京語などに翻訳してみせている。この技術は同社のクラウドプラットフォームWindows Azureを利用しており、言語や変換のクセを学習させる必要はないという。
さらにこのデモでは、Webカメラで撮影した映像から3Dモデルと表情のテクスチャを自動生成するアバターを作り、話すときの顔も再現してみせた。この技術が実用化されれば、将来的にはスマートフォンで海外の人と話すと、ほぼリアルタイムで通話を翻訳して会話のできる時代が来る……といいなあ。
某少年探偵の蝶ネクタイ的なものはマダー? (スコア:2)
音声と言えば、同様に昔からアイデアとしてはあった「変声機」も
今の匿名音声みたいな変な声にするだけじゃなくて、他人の声音どおりに装えるやつが
そろそろ実現可能じゃないかと思うんですが、こちらは犯罪に使われそうな予感・・・。
Re:某少年探偵の蝶ネクタイ的なものはマダー? (スコア:3)
そんなものがあったら、ハンガーが偶然飛んできただけで、殺人事件が起こってしまいます。
Re: (スコア:0)
Re: (スコア:0)
nhkのVOCALID特集でやってたが、少しのサンプルから他人の声は合成出来るらしい。
今の音声認識との組み合わせだとラグが出る。
しゃべる→文字化→音声合成 がリアルタイムで出来ればいけるかも?
業界の中の人ですが (スコア:0)
NHKの特集でやってた障害者向けの音声合成の2つデモはVocaloidとはちょっと違う技術なのですよ.
1つめのエジンバラ大学のはテキストから音声を合成するものでVocaloidと近い技術ですが,
Vocaloidのほうは音声波形をつなげて音声を合成するのに対して,
エジンバラのデモでは音声に関する統計モデルから音声に関係するパラメータを生成して音声を合成するタイプなのです.
2つめの奈良先端科学技術大学院大学のデモは入力音声を直接変換して出力していますので,音声認識処理はしていません.
ではなぜラグがあるかというと,音声を入力してから分析して音声を変換,音声波形へ戻すという一連の信号処理プロセスが原因なのです.
ちなみに,こちらも声色を変換するためのフィルタに統計モデルを使っています.
方言のマッチング (スコア:2)
大阪弁がテキサス訛りになったりするんですかね
Re:方言のマッチング (スコア:1)
ドラマを見てると「自分」という言葉が「Me」なのか「You」なのか迷うときがあるけど、
機械はちゃんと判読できるのかな?
#と思う東北弁AC
Re:方言のマッチング (スコア:2)
自分は"I"や"you","myself","yourself"にはなっても"me"にはならんでしょ。
#とおもう畿内ハイブリッドなID
Re: (スコア:0)
Re: (スコア:0)
Re:方言のマッチング (スコア:1)
心配するまでもなく、日本語の場合、主語と述語と修飾子の係り受けが厳密に記述されている標準語以外まともに翻訳できません。機械翻訳しやすい日本語で文章を書くというのも、ちょっとした技術と慣れが必要なんです。
Re:方言のマッチング (スコア:1)
向こうのアニメファンがケロちゃんの大阪弁をブルックリン訛り [wikipedia.org]みたいなものと表していたことがありました.
テキサス訛りはもしかしたら薩摩弁なみなのかも.
Re: (スコア:0)
はい。
大阪は釜山訛りです。
Re: (スコア:0)
自分の日本の標準語喋りがテキサス訛りやコックニーに翻訳されたら、なんか嫌かも
→なんで訛りに翻訳されるの?
→あなたの発音に訛りがあるんです、仕様です。
Re: (スコア:0)
南部訛り=茨城なイメージ
日本の方言は別言語として扱わないと無理な気が。特に津軽弁とか。
Re: (スコア:0)
>南部訛り=茨城なイメージ
岩手県北部じゃなくて?
それとも青森県南部か?
#南部煎餅の産地は岩手だと…
岩手南部と宮城北部境界民なのでAC
青森県における南部煎餅の位置づけ (オフトピ: -1) (スコア:1)
南部煎餅はずいぶん前から青森県内各地でもいくつもの煎餅店によって作られてます。ふだんづかいのおやつや土産物として堅実な商品になってますよ。新しいものとしては近年八戸では南部煎餅を汁物の具にするのを広めようと宣伝を始めているし。
青森駅の隣の駅ビル、ラビナには巖手屋が出店しているので岩手県産の知名度というのもふつうにあるようですが、地元コンビニ・スーパーで日常おやつ用に売られているのは青森県内産の薄手で廉価なタイプが多いと思う。
2000年頃のロードマップ(遠い目) (スコア:1)
AMDのCPUの将来計画で2005年頃、30GHzくらいを超えると、
やっと同時翻訳が出来るかな?とか書いてあったのを思い出した(走召糸色木亥火暴)
ほんとに、まだーチンチン!ですね(南無)
"castigat ridendo mores" "Saxum volutum non obducitur musco"
Re:2000年頃のロードマップ(遠い目) (スコア:1)
「ざっくばらんに3GHzのCPUを10並列並べればできそう」っていう話なら.
その程度であれば簡単にスケールするからAzure使えばいいじゃん,
という論調になってもおかしくないとは思いますね.
ところで, 英語がビジネスレベルで流暢な日本人でも,
日本語を話す場合と英語を話す場合とでかなり声が違うことが多い気がしますけど…
アニメの海外展開 (スコア:1)
声優さんが喋ったセリフで英語音声、スペイン語音声などが瞬時にできるのかな?
日本と同時に各国語版が世界中に配信できたら、Fun sub 動画なくなるだろうな。
# Funsubの英訳は面白いので、見れなくなったら寂しいけどね。
Re: (スコア:0)
# Fansubです
「わ”~れ”~わ”~れ”~わ”、宇”~宙”~人”~て”~あ”~る”」 (スコア:1)
声にするよりも先に… (スコア:0)
文字ベースの機械翻訳で、お笑いでなく、実用レベルのものを作ってください。
Re: (スコア:0)
おそらく印欧語族同士ではすでに十分実用的なので、外国企業に期待したって無駄ですよ。
Re: (スコア:0)
今、日英・英日の機械翻訳の研究の最先端は、どこなんでしょうね。
Re: (スコア:0)
NTT?
Re: (スコア:0)
NICTとかNECとか東芝とか?
Re: (スコア:0)
中学校じゃないかな。
Re: (スコア:0)
MSのTechnetの機械翻訳が読むに堪えない状態であることは、有名な話ですからね。
Re: (スコア:0)
あれが一番読まれる機械翻訳コンテンツなだけでしょ。
あれでも、Bing翻訳 > Google翻訳らしいし。