アカウント名:
パスワード:
たんにromにあるpcmのデータ再生してるだけだよ。
今は、生声を録音した音素片をPCM再生する「波形接続型合成」が主流だけど、
Speek&Spellの時代の音声合成は、たいがいフォンルマント合成だよ。ざっくり言えば、5個程度の異なる周波数の信号の合成で、その周波数の比率でどの音かの認識が変わります。最低限2つの音を合成するだけでも、人は認識できる。
だから、極端に言えば、二つの発信器で適切な周波数比率の音を出すだけで、音声合成可能。ただし、「言葉として認識できる」だけで、品質としては余り良くない。いわゆるロボットボイスってやつです。
ネットであふれている初音ミクの歌は合成音声じゃない録音された合成音声の歌を再生しているだけだ
なんかこれ思い出した。
「完全に理解した」製品を利用をするためのチュートリアルを完了できたという意味。
「なにもわからない」製品が本質的に抱える問題に直面するほど熟知が進んだという意味。
「チョットデキル」同じ製品を自分でも1から作れるという意味。または開発者本人。
広い意味ならPCMと言えないこともないがあの頃のは大体LPC(ADPCMですらない)
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ソースを見ろ -- ある4桁UID
元々音声合成なんてものじゃない (スコア:0)
たんにromにあるpcmのデータ再生してるだけだよ。
Re:元々音声合成なんてものじゃない (スコア:2)
今は、生声を録音した音素片をPCM再生する「波形接続型合成」が主流だけど、
Speek&Spellの時代の音声合成は、たいがいフォンルマント合成だよ。
ざっくり言えば、5個程度の異なる周波数の信号の合成で、その周波数の比率でどの音かの認識が変わります。
最低限2つの音を合成するだけでも、人は認識できる。
だから、極端に言えば、二つの発信器で適切な周波数比率の音を出すだけで、音声合成可能。
ただし、「言葉として認識できる」だけで、品質としては余り良くない。
いわゆるロボットボイスってやつです。
Re: (スコア:0)
ネットであふれている初音ミクの歌は合成音声じゃない
録音された合成音声の歌を再生しているだけだ
Re: (スコア:0)
なんかこれ思い出した。
「完全に理解した」
製品を利用をするためのチュートリアルを完了できたという意味。
「なにもわからない」
製品が本質的に抱える問題に直面するほど熟知が進んだという意味。
「チョットデキル」
同じ製品を自分でも1から作れるという意味。または開発者本人。
Re: (スコア:0)
広い意味ならPCMと言えないこともないが
あの頃のは大体LPC(ADPCMですらない)