パスワードを忘れた? アカウント作成
2090156 story
テクノロジー

Microsoft、自分の声で26か国語を話せる「翻訳こんにゃく」的技術を公開 30

ストーリー by hylom
さすがに食べられはしませんが 部門より
taraiok 曰く、

Microsoft ResearchはTechFest 2012の基調講演で、テキストデータとして入力された文章を26か国語に翻訳、話し言葉として読み上げる通訳技術デモを公開した(本家/.technology reviewExtreamTech記事Engadget Japanese)。

このデモのポイントとしては、音声入力したユーザーのアクセントや声色、イントネーションを維持した上で、その音声を再構成する形で26か国語に翻訳してしまうこと。つまりドラえもんの秘密道具「翻訳こんにゃく」のように、音声入力者がネイティブで26か国語が話せる技術に一歩近づいたと言える。

デモでは長めの英語の文章を入力し、それをイタリア語やスペイン語、北京語などに翻訳してみせている。この技術は同社のクラウドプラットフォームWindows Azureを利用しており、言語や変換のクセを学習させる必要はないという。

さらにこのデモでは、Webカメラで撮影した映像から3Dモデルと表情のテクスチャを自動生成するアバターを作り、話すときの顔も再現してみせた。この技術が実用化されれば、将来的にはスマートフォンで海外の人と話すと、ほぼリアルタイムで通話を翻訳して会話のできる時代が来る……といいなあ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 音声と言えば、同様に昔からアイデアとしてはあった「変声機」も
    今の匿名音声みたいな変な声にするだけじゃなくて、他人の声音どおりに装えるやつが
    そろそろ実現可能じゃないかと思うんですが、こちらは犯罪に使われそうな予感・・・。

    • そんなものがあったら、ハンガーが偶然飛んできただけで、殺人事件が起こってしまいます。

      親コメント
    • by Anonymous Coward
      エレキギターのエフェクターなら、ノーマルのチューニングのまま、 エフェクターを通して音程を変えるってものは既にありますねぇ。
    • by Anonymous Coward

      nhkのVOCALID特集でやってたが、少しのサンプルから他人の声は合成出来るらしい。
      今の音声認識との組み合わせだとラグが出る。

      しゃべる→文字化→音声合成 がリアルタイムで出来ればいけるかも?

      • NHKの特集でやってた障害者向けの音声合成の2つデモはVocaloidとはちょっと違う技術なのですよ.
        1つめのエジンバラ大学のはテキストから音声を合成するものでVocaloidと近い技術ですが,
        Vocaloidのほうは音声波形をつなげて音声を合成するのに対して,
        エジンバラのデモでは音声に関する統計モデルから音声に関係するパラメータを生成して音声を合成するタイプなのです.

        2つめの奈良先端科学技術大学院大学のデモは入力音声を直接変換して出力していますので,音声認識処理はしていません.
        ではなぜラグがあるかというと,音声を入力してから分析して音声を変換,音声波形へ戻すという一連の信号処理プロセスが原因なのです.
        ちなみに,こちらも声色を変換するためのフィルタに統計モデルを使っています.

  • by mokusatsu (25839) on 2012年03月15日 13時47分 (#2118059) 日記

    大阪弁がテキサス訛りになったりするんですかね

    • by Anonymous Coward on 2012年03月15日 14時28分 (#2118095)

      ドラマを見てると「自分」という言葉が「Me」なのか「You」なのか迷うときがあるけど、
      機械はちゃんと判読できるのかな?

      #と思う東北弁AC

      親コメント
    • by SteppingWind (2654) on 2012年03月15日 18時08分 (#2118239)

      向こうのアニメファンがケロちゃんの大阪弁をブルックリン訛り [wikipedia.org]みたいなものと表していたことがありました.

      テキサス訛りはもしかしたら薩摩弁なみなのかも.

      親コメント
    • by Anonymous Coward

      はい。
      大阪は釜山訛りです。

    • by Anonymous Coward

      自分の日本の標準語喋りがテキサス訛りやコックニーに翻訳されたら、なんか嫌かも
      →なんで訛りに翻訳されるの?
      →あなたの発音に訛りがあるんです、仕様です。

    • by Anonymous Coward

      南部訛り=茨城なイメージ

      日本の方言は別言語として扱わないと無理な気が。特に津軽弁とか。

      • by Anonymous Coward

        >南部訛り=茨城なイメージ
        岩手県北部じゃなくて?
        それとも青森県南部か?
        #南部煎餅の産地は岩手だと…
        岩手南部と宮城北部境界民なのでAC

        • 南部煎餅はずいぶん前から青森県内各地でもいくつもの煎餅店によって作られてます。ふだんづかいのおやつや土産物として堅実な商品になってますよ。新しいものとしては近年八戸では南部煎餅を汁物の具にするのを広めようと宣伝を始めているし。
          青森駅の隣の駅ビル、ラビナには巖手屋が出店しているので岩手県産の知名度というのもふつうにあるようですが、地元コンビニ・スーパーで日常おやつ用に売られているのは青森県内産の薄手で廉価なタイプが多いと思う。

          親コメント
  •  AMDのCPUの将来計画で2005年頃、30GHzくらいを超えると、
    やっと同時翻訳が出来るかな?とか書いてあったのを思い出した(走召糸色木亥火暴)

     ほんとに、まだーチンチン!ですね(南無)

    --
    "castigat ridendo mores" "Saxum volutum non obducitur musco"
    • 「ざっくばらんに3GHzのCPUを10並列並べればできそう」っていう話なら.
      その程度であれば簡単にスケールするからAzure使えばいいじゃん,
      という論調になってもおかしくないとは思いますね.

      ところで, 英語がビジネスレベルで流暢な日本人でも,
      日本語を話す場合と英語を話す場合とでかなり声が違うことが多い気がしますけど…

      親コメント
  • by unchikun (14429) on 2012年03月15日 20時23分 (#2118286)

    声優さんが喋ったセリフで英語音声、スペイン語音声などが瞬時にできるのかな?
    日本と同時に各国語版が世界中に配信できたら、Fun sub 動画なくなるだろうな。

    # Funsubの英訳は面白いので、見れなくなったら寂しいけどね。

  • 鳩山元総理の声で言ってみたいところです
  • by Anonymous Coward on 2012年03月15日 15時30分 (#2118144)

    文字ベースの機械翻訳で、お笑いでなく、実用レベルのものを作ってください。

    • by Anonymous Coward

      おそらく印欧語族同士ではすでに十分実用的なので、外国企業に期待したって無駄ですよ。

    • by Anonymous Coward

      今、日英・英日の機械翻訳の研究の最先端は、どこなんでしょうね。

    • by Anonymous Coward

      MSのTechnetの機械翻訳が読むに堪えない状態であることは、有名な話ですからね。

      • by Anonymous Coward

        あれが一番読まれる機械翻訳コンテンツなだけでしょ。
        あれでも、Bing翻訳 > Google翻訳らしいし。

typodupeerror

開いた括弧は必ず閉じる -- あるプログラマー

読み込み中...