アカウント名:
パスワード:
音声と言えば、同様に昔からアイデアとしてはあった「変声機」も今の匿名音声みたいな変な声にするだけじゃなくて、他人の声音どおりに装えるやつがそろそろ実現可能じゃないかと思うんですが、こちらは犯罪に使われそうな予感・・・。
nhkのVOCALID特集でやってたが、少しのサンプルから他人の声は合成出来るらしい。今の音声認識との組み合わせだとラグが出る。
しゃべる→文字化→音声合成 がリアルタイムで出来ればいけるかも?
NHKの特集でやってた障害者向けの音声合成の2つデモはVocaloidとはちょっと違う技術なのですよ.1つめのエジンバラ大学のはテキストから音声を合成するものでVocaloidと近い技術ですが,Vocaloidのほうは音声波形をつなげて音声を合成するのに対して,エジンバラのデモでは音声に関する統計モデルから音声に関係するパラメータを生成して音声を合成するタイプなのです.
2つめの奈良先端科学技術大学院大学のデモは入力音声を直接変換して出力していますので,音声認識処理はしていません.ではなぜラグがあるかというと,音声を入力してから分析して音声を変換,音声波形へ戻すという一連の信号処理プロセスが原因なのです.ちなみに,こちらも声色を変換するためのフィルタに統計モデルを使っています.
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ
某少年探偵の蝶ネクタイ的なものはマダー? (スコア:2)
音声と言えば、同様に昔からアイデアとしてはあった「変声機」も
今の匿名音声みたいな変な声にするだけじゃなくて、他人の声音どおりに装えるやつが
そろそろ実現可能じゃないかと思うんですが、こちらは犯罪に使われそうな予感・・・。
Re: (スコア:0)
nhkのVOCALID特集でやってたが、少しのサンプルから他人の声は合成出来るらしい。
今の音声認識との組み合わせだとラグが出る。
しゃべる→文字化→音声合成 がリアルタイムで出来ればいけるかも?
業界の中の人ですが (スコア:0)
NHKの特集でやってた障害者向けの音声合成の2つデモはVocaloidとはちょっと違う技術なのですよ.
1つめのエジンバラ大学のはテキストから音声を合成するものでVocaloidと近い技術ですが,
Vocaloidのほうは音声波形をつなげて音声を合成するのに対して,
エジンバラのデモでは音声に関する統計モデルから音声に関係するパラメータを生成して音声を合成するタイプなのです.
2つめの奈良先端科学技術大学院大学のデモは入力音声を直接変換して出力していますので,音声認識処理はしていません.
ではなぜラグがあるかというと,音声を入力してから分析して音声を変換,音声波形へ戻すという一連の信号処理プロセスが原因なのです.
ちなみに,こちらも声色を変換するためのフィルタに統計モデルを使っています.