アカウント名:
パスワード:
この人がこんなことを!ってなこと言わすにも使えそうです。
実在人物の声でしゃべる音声合成システムはすでにあります。 InfoTalker [ascii24.com] とか Speechify [zdnet.co.jp] とか。 ただし,これらのシステムはサンプルを大量に取る必要がありますし(Speechify の記事では「数十時間」と言っております), サンプルで取った音声の部品を組み合わせるだけなので, どんな状況の声でも合成できるというわけではないと思います。 [怒
[怒声とか笑い声とか嬌声とか喘ぎ声 :-) とかは, そういうサンプルを取らなければだせないでしょう。]
データを取るだけだと難しいかもしれませんね。 #まあ、「喘ぎ声の『あぁ』」に「普
言語によって合成の最小単位になる音素が違ってくるでしょうから、言語ごとに適した音素ラベルを設定する労力が掛かるんじゃないかと。
リエゾン(前後の音をくっつけて発音すること)がある分だけ 欧米圏の言語のほうが難しいような気がします.例えば, get it all はゲティトー
日本語の口語でもリエゾンに相当するものもあるかもしれない。 ちょっとすぐに例が出てこなくてすみません。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
普通のやつらの下を行け -- バッドノウハウ専門家
故人じゃなくても (スコア:1)
「プロプライエタリもいいんじゃない?たまにはさ」とRMS氏に言わせてみたり、
「次期Windowsはソースを公開し、正式名称をMS GNU/Win32とします。」とB.G氏に言わせてみたり。
Re:故人じゃなくても (スコア:2, 参考になる)
実在人物の声でしゃべる音声合成システムはすでにあります。 InfoTalker [ascii24.com] とか Speechify [zdnet.co.jp] とか。 ただし,これらのシステムはサンプルを大量に取る必要がありますし(Speechify の記事では「数十時間」と言っております), サンプルで取った音声の部品を組み合わせるだけなので, どんな状況の声でも合成できるというわけではないと思います。 [怒
Re:故人じゃなくても (スコア:2, 興味深い)
ただ、CHATRの合成は、アクセントやイントネーションがかなりおかしいのが難点です。そういう研究も継続してされているでしょうから、今はどうなのか知りませんが、二年ほど前は、まだまだでした…。
そんなわけで、
データを取るだけだと難しいかもしれませんね。
#まあ、「喘ぎ声の『あぁ』」に「普
Re:故人じゃなくても (スコア:2, すばらしい洞察)
リエゾン(前後の音をくっつけて発音すること)がある分だけ 欧米圏の言語のほうが難しいような気がします.例えば, get it all はゲティトー
Koichi
日本語と外国語 (スコア:1)
実はその概念を無意識に使っているというようなものが
あったりします(声調とか)。
日本語の口語でもリエゾンに相当するものもあるかもしれない。
ちょっとすぐに例が出てこなくてすみません。
Re:日本語と外国語 (スコア:1)
リエゾンじゃないですが、似たようなものとしては「せんたくき」が「せんたっき」とか、「たいいく」が「たいく」っぽく聞こえるのとか。表記と口語の発声が一致しないものはそこそこありますね。
ただ、日本語(標準語)の場合は、リエゾン(にあたる発音)をしなければそれらしく聞こえない…という例はほとんどないように思います。少なくても仮名表記に従って発声して、通じないことは無いでしょう。例外は「へ」と「は」くらい。
おそらく、標準語を構築する際に、仮名の存在をかなり意識して行ったからだろうと思うのですが…。
#地方の人の話し方を合成するとなると難しいだろうなあ(^^;;