アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲは一日にしてならず -- アレゲ見習い
認識率がいい (スコア:3, 興味深い)
でも、でたらめな言葉を入れるとぜんぜんだめ。ハナモゲラ語には対応していない模様。
#推測しながらテキスト変換しているのかな?
Re:認識率がいい (スコア:5, 興味深い)
一般に音声認識では、単語の情報を辞書として保持しています。
決して、音のならびだけで認識しているわけではありません。
弱点として、当然ですが、知らない単語(辞書に含まない単語)を認識することはできません。
その対策として、コーパスを作って、単語を抽出し、辞書を作ったりするのですが、
新しい単語がどんどん生まれたりと、単語の情報を集めるのに苦労しています。
そこで今回の試みでは、利用者のみなさまから音声認識してほしい単語の情報を集めてみようと思っています。
http://w3vo [w3voice.jp]
Re:認識率がいい (スコア:1)
ところで今、目の前のテレビでちょうどアジアカップやってたので、「なかむらしゅんすけ」など吹き込んで遊んでみました。
(予想通り「俊輔」で変換されます)
Jリーグのいくつかのチーム名もやってみたのですが…
「コンサドーレ札幌」がいくら頑張ってもちゃんと認識されず寂しかったので登録したのですが…
発音が悪いのでしょうか?それともJ2だからなのでしょうか(苦笑)
アレゲやないわ!! 興味津々なだけや!!!
Re:認識率がいい (スコア:3, 興味深い)
言語情報は、コーパスを収集して、そこから統計情報を抽出することで作成されています。
このため、もととなったコーパスの性格を引き継ぎます。
今回、Webをクロールしてコーパスを作成していますが、比較的出現回数が少ない単語だと、
辞書から除外されてしまいます。まあ、つまり、J2だから。かと。
音声認識で、単語がなかなか出てくれない原因はほかにもいろいろあるんですが、
出力されないからといって落ち込まないようにお願いします。
固有名詞の音声認識はなかなか難しいのです。
ちなみに、いま、組み込んである言語モデルでは、放送局の名前が比較的よく認識されるようにチューニングしてあります。
# Web上から番組表みれたら便利かなとおもってチューニングしたんだけど、肝心の番組表をブラウズする部分を作っていない…
Re:認識率がいい (スコア:1)
試しに全国の駅名データを音声認識辞書に登録してみました。
これがうまくうごけば、Googleトランジットが音声だけで使えるのですが。
http://w3voice.jp/engine/ [w3voice.jp] から、どうぞ。
「○○駅から○○駅」で、経路探索ができます。
きびしいかな…。
Re:認識率がいい (スコア:0)
ついでに、マイナーな地元駅で試しても、成功。
実用性はともかくとして、少し未来を先取りしたみたいで、楽しいですね。