業界の中の人ですが (#2118233) | Microsoft、自分の声で26か国語を話せる「翻訳こんにゃく」的技術を公開

「Microsoft、自分の声で26か国語を話せる「翻訳こんにゃく」的技術を公開」記事へのコメント

記事ページを表示すべてのコメント取得

検索30コメント Log In/Create an Account

某少年探偵の蝶ネクタイ的なものはマダー？ (スコア:2)

by ikotom (20155)

音声と言えば、同様に昔からアイデアとしてはあった「変声機」も
今の匿名音声みたいな変な声にするだけじゃなくて、他人の声音どおりに装えるやつが
そろそろ実現可能じゃないかと思うんですが、こちらは犯罪に使われそうな予感・・・。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  nhkのVOCALID特集でやってたが、少しのサンプルから他人の声は合成出来るらしい。
  今の音声認識との組み合わせだとラグが出る。
  しゃべる→文字化→音声合成がリアルタイムで出来ればいけるかも？
  - 業界の中の人ですが (スコア:0)
    
    by Anonymous Coward on 2012年03月15日 17時55分 (#2118233)
    
    NHKの特集でやってた障害者向けの音声合成の２つデモはVocaloidとはちょっと違う技術なのですよ．
    １つめのエジンバラ大学のはテキストから音声を合成するものでVocaloidと近い技術ですが，
    Vocaloidのほうは音声波形をつなげて音声を合成するのに対して，
    エジンバラのデモでは音声に関する統計モデルから音声に関係するパラメータを生成して音声を合成するタイプなのです．
    ２つめの奈良先端科学技術大学院大学のデモは入力音声を直接変換して出力していますので，音声認識処理はしていません．
    ではなぜラグがあるかというと，音声を入力してから分析して音声を変換，音声波形へ戻すという一連の信号処理プロセスが原因なのです．
    ちなみに，こちらも声色を変換するためのフィルタに統計モデルを使っています．
    
    シェア
    
    親コメント

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

Microsoft、自分の声で26か国語を話せる「翻訳こんにゃく」的技術を公開 More ログイン

「Microsoft、自分の声で26か国語を話せる「翻訳こんにゃく」的技術を公開」記事へのコメント

某少年探偵の蝶ネクタイ的なものはマダー？ (スコア:2)

Re: (スコア:0)

業界の中の人ですが (スコア:0)

スラド