言葉を瞬時に文字化するCPU 84
ストーリー by yoosee
「コンピュータ、スラドに繋いでくれ」 部門より
「コンピュータ、スラドに繋いでくれ」 部門より
Anonymous Coward曰く、"asahi.comの記事によると、NECは、話されている言葉を瞬時に文字化できる携帯電話用CPUを開発した。携帯電話の音声操作や、携帯電話での自動翻訳機能の実装を目指す。
記事によると、NECは「音声信号を区切ったそれぞれの言葉の後ろから処理を行い、マッチする言葉の候補を絞りこむ」「3個のCPUで並行処理を行う」等で処理時間を従来の5分の1に短縮した。認識率は約85%。"
ヤッターマン コーヒー ライター (スコア:2, おもしろおかしい)
どのように文書化するのか気になるところ
Re:ヤッターマン コーヒー ライター (スコア:1)
吉田松陰物語(個人手に大好き)とか
どうなるのか知りたい。
NECのプレスリリース (スコア:2, 参考になる)
以下は勘ですが,
あたりが技術的課題となったんじゃないかと想像します。
「コンピュータ、スラドに繋いでくれ」 (スコア:1, おもしろおかしい)
Re:「コンピュータ、スラドに繋いでくれ」 (スコア:1)
Re:「コンピュータ、スラドに繋いでくれ」 (スコア:1)
音声認識率と翻訳の変換精度を考えると当面実用化は無いという方向でおk?
いやその前に (スコア:1, すばらしい洞察)
「スラド?スラッシュドットの事か?
http://slashdot.org/それとも http://srad.jp/
どっちやねん!!てめー人間の癖に略しすぎやど!!
これだから最近の人間は。。。」
っと説教をされそう
Re:「コンピュータ、スラドに繋いでくれ」 (スコア:1)
>はい
うむ、その2番目のトピックを開いてくれ
>はい
なるほど、うん? このpresaoriとやら生意気だな、攻撃の書き込みだ! 中身は適当にたのむ
>攻撃を開始しました
よしよし
#いやだいやだ
Re:「コンピュータ、スラドに繋いでくれ」 (スコア:1)
認識率を得られるかってーと疑問だったりする。
「ごめん、ちょっと今のもう一回」
何に使うんだ? (スコア:1, おもしろおかしい)
と空目しちゃっターyo!
携帯電話の場合 (スコア:1, 興味深い)
できなさそうな。
文脈を考慮しないと、音声認識ってほとんど実用にならないですよね。
まぁそれもいずれメモリの高密度化で解決されるのでしょうが。
ギガバイト単位のフラッシュメモリを持つのが当たり前になるんでしょうかね、
将来の携帯電話は。
Re:携帯電話の場合 (スコア:1)
文脈といっても、短い会話だけでは情報の絶対量が足りないよね。翻訳ソフトの結果とか見ると、今のソフトは結構物知りみたいだが、知識が偏ったヘンな人って感じがする。人間の場合は、何年~何十年もかけて蓄積したデータをうまく使って話をしている。会話した相手とその内容、履歴をずっと記憶しておいて、この相手なら今度はこういうことを言いそうだと類推するのだろうが、判断が正しかったかどうか機械に教えて学習させないといけないはずだ。それはどのようなユーザーインターフェースになるんだろう。
Re:携帯電話の場合 (スコア:1)
短い会話だけですむ、ということは、内容がそれだけ単純なのか、文脈が十分に共有されているか、のどちらかではないでしょうか?
『たほいや』を辞書で引いてもらう、って場合はあまり文脈の共有は無いんでしょうけど、そういう場合は相手が人間であっても、「は?たほ…なに?もう一遍言ってみて」って会話になるんじゃないでしょうか。
Re:携帯電話の場合 (スコア:1)
>そういう場合は相手が人間であっても、「は?たほ…なに?もう一遍言ってみて」って
>会話になるんじゃないでしょうか。
人は、相手が人間の場合はミスに寛容になれますが、相手が機械だと全然寛容になれない
ということが最大の問題です。
Re:携帯電話の場合 (スコア:1)
#MSのおかげで…とか言うと、フレームの元か。
Re:携帯電話の場合 (スコア:1)
Ajaxっすか?
さらに翻訳機能がつくと (スコア:1)
でも、認識率85%だと日本語OCRと比較してもずいぶん悪いし、
たぶん丁寧な言葉でないと認識されないだろうし、
翻訳ソフトの精度の方も機能向上待ちだし、実現はずいぶん先でしょうか。
Re:さらに翻訳機能がつくと (スコア:2, 参考になる)
今回のは、認識率を誇るというよりは、携帯電話に内蔵してリアルタイムに使える、というのがミソなのでしょう。
一刻も早くPCに (スコア:1, 興味深い)
一刻も早くPCに取り込んで欲しいのはこういうデバイスだったりする。
キーボードに慣れちゃったせいで言葉づかいから脳みその使い方から
どこか変になっている実感が確実にある。
すでにあるものは一通り試したのだがどうもいかん。
85%どころの騒ぎじゃなかったし、あまりにリアルタイム性に欠けていた。
声に出して考えるのとキーボードとマウスで打ちながら考えるのでは
どちらがよいかは別として全くちがう感覚だろうし
PCに向き合う際の感覚が増えるというのは実は、
キーボードでかちゃかちゃやるしかなかったPCが
マウス中心のGUIになった時くらいの大変革を生むかも
などと個人的には思っているのだが。
Re:一刻も早くPCに (スコア:2, おもしろおかしい)
複数のファイルをフォルダ間で移す場合:
「あ。それをつまんで」
「もっと。そっちのも」
「そう、そこ」
「もっと、もっと左の方…」
「そう。そこへ入れて」
「あっ、ちがう。そこなくて…」
なんってのを後ろの席のきれいなおねいさんにやられた日には仕事になりません。
Re:一刻も早くPCに (スコア:1, 参考になる)
当時は認識率が悪い上に、コンピュータが聞き取りやすいようにテイネイに話さないといけないので苦痛でした(使用前にクセを登録する仕組みだったのに全然役に立たなかった)。
Re:一刻も早くPCに (スコア:1, すばらしい洞察)
#意図しない命令が入りやすい&命令を覚えないとだめとかある悪寒。
文章書いている姿を決して覗いてはなりません (スコア:1)
滑舌よく話す必要があったり、誰かがいるところで使えないという心理的な抵抗感が拭いきれませんでした。
電車など公共の場での携帯電話が、せっかく通話や着信音以外で容認されてきていますが、
文字入力のために携帯に向かってしゃべっているようでは、傍目に通話と変わらないのでは。
モデレート したいときには 権利なし
かつかれー
独り言の多い奴 (スコア:1, 興味深い)
やっている本人はいいかもしれないが周りから見ると
「ぶつぶつうるさい奴」「機械に話しかける変な奴」
でしかない
という点で実用性に難あり、と思っていました。
なので、音声認識・制御のPCへの応用に関しては、爆発的な普及はないものの、
認識精度とスピードがあがれば執筆関係など特定用途には定着していく、
そんな性格のものと捉えています。
ただ、携帯電話に関してはそれ自身が「話しかけて使う機械」なので、
これを突破口として屋外での利用を中心に音声認識・制御が
広まることもあるかもしれないと、最近思い直しています。
少なくとも「携帯電話でしゃべっている人間」を見ても、
すでに「機械に話しかけている変な奴」とは思わないでしょう?
#夜道で向こうからぶつぶつ言いながら歩いてくるやつは
間違いなく携帯で話している奴だ。
もしそうでないと分かったら、その瞬間に俺は逃げるよ。
Re:独り言の多い奴 (スコア:2, 参考になる)
(オフトピック)独り言の多い奴 (スコア:1)
すいません。debugでハマっている時にロジックのおさらいをしていてぶつぶつ言いながら歩いていることがあります。(^_^;もっとも私の場合、会社敷地内の駐輪場まで。歩きとか電車通勤だったら逃げられそうですね。(笑)
そういえば20年以上前ですが、「巨人阪神広島、巨人阪神広島」と独り言を言いながら、私の脇を自転車ですり抜けていった人がいました。え?と思って見ていると、突然止まって空を飛んでいる飛行機に手拳銃を向けて「バーン」。再び自転車をこぎだした彼の姿はあっという間にみえなくなりました。
「あれは何だったんだろうか?」というのは未だに私にとって謎です。
vyama 「バグ取れワンワン」
Re:独り言の多い奴 (スコア:1, 参考になる)
私は不審者認定されたということですね…。
Re:一刻も早くPCに (スコア:1)
おそらく、下書きをキーボードで入力してそれを印刷して、
紙を見ながら読み上げて認識させるのが一般的なスタイルになるかと思います。
1を聞いて0を知れ!
Re:一刻も早くPCに (スコア:1)
人/場面によるんだろうけど。
Re:まずはゲームから (スコア:1)
Re:この道はいつかきた道 (スコア:1)
を逆行する事になるのかな?
らじゃったのだ
具体的にはどのシリーズのCPUになるんだろ? (スコア:1)
(新しく携帯向けのVr41xx系を作ったとか?)
可能性が高いものとしてはV800シリーズかな?
(V85x+ARMのマルチコアあたり??)
まさか78Kコアを数百個実装したとか(^^;)
NECの既存のCPUファミリとは別系統のシリーズになる?
音声の自動認識というといつも気になるのが (スコア:1)
「標準語」とか言う得体の知れない言葉は話せない! という人もけっこう多いと思うんですけど、そのあたりはどうなんでしょうかね。システムに合わせた発音矯正が必要だったりすると本末転倒。
#博多弁モジュールとか名古屋弁モジュールとかを加える?
マンモスの肉の次は言葉を文字化か? (スコア:1)
話し言葉ではないらしい (スコア:1)
そっちの認識率は「70~80%」ということだから、このCPUは話し言葉用じゃないってことでしょうね。
あと音声認識関連だと、音声認識ベンチャーのアドバンストメディアの株価が凄い [cnet.com]ことに…。
ナイト2000作って~ (スコア:1)
「はいマイケル。」
まだ無理?w
これで社会福祉に (スコア:1)
ただ、一方で速記を職としている方には迷惑かも。
SF映画のコンピューターと対話するシーンが現実になると言う事ですね。
人間「コンピュータ、情報103(イチ・マル・サン)を画面に表示せよ」
コンピュータ「ファイルにパスワードが掛けられています。パスワードを言ってください。」
人間「12345」
コンピュータ「パスワード一致、ファイルオープン。」
なんていう、映画のワンシーンを想像しました。
この記事のタイトル読んだとき「文字化」が「文字化けに」見えてしまった org
Li-ion DC 1.2V(定格:3.7V) 500mA 乾電池はリサイクルへ
Re:これで社会福祉に (スコア:1)
『XXXXX』
『認証に失敗しました。もう一度大きな声で。』
『XXXXX!』
セキュリティホールになりそうですね(笑
Re:おお、これで (スコア:2, おもしろおかしい)
そのまんま書くと、上司達の仁義なき派閥争いに油を注ぐことになるから。
#いかに「忌憚のない意見のやりとり」に書き換えるかで苦労してるんですよ。
#「君、議事録書くのうまいねぇ」なんて褒めるのなら、
#子供の喧嘩みたいなこと会議の席で言わないでください。部長さんたち。
#だから役員会のことを「妖怪大戦争」って言われてるんですよ。
Re:おお、これで (スコア:2, 参考になる)
「書記」ではなく「速記」かと思いますが,衆参両院とも,昨年度に国会速記の廃止が既に決定されています。現在,新規の国会速記者の養成は停止されているはずです(参考 [asahi.com])。
# あくまで
地方議会では,沼津市議会が音声入力システムを導入しています [advanced-media.co.jp]。まあ,現時点で音声入力だけで議事録を完成させるのは無理だとは思いますが。
Re:おお、これで (スコア:1)
うっ,すみません,ゴミが残りました。「あくまで」の続きは,「速記者の養成が停止されたということであって,現在いる速記者の方々がいなくなったというわけではありません」でした。
Re:おお、これで (スコア:1)
「全部CPUが悪いのだ」
とか言いだしますね。
#やっぱりだめだ。
spam嫌いなbeefeater
でも豚肉は好き
Re:おお、これで (スコア:1)
いや、あの人は「言語明瞭、意味不明瞭」で有名だったのだから、
音声→文字化は簡単だが、文章→意味解析のほうで困るんだと思う。
Re:おお、これで (スコア:1)
別の人のことでは?
意味不明瞭は竹下さんだったようですが、
言語不明瞭は大平さんだったような気が。
#あーうーおほほなのでG7
Re:おお、これで (スコア:1)
速記との入れ替えはできませんね。
録音で全てがまかなえないのも、発言がかぶったときに、
発言者の特定ができないためと、聞いたことがあります。
Re:おお、これで (スコア:1)
ある時携国会議事録を記録していた携帯電話が急に動かなくなった。
いろんな技術者が調べたがいっこうに直らず、ある左腕のない
コンピュータ技師 が呼ばれることになった。そのコンピュータ技師は
みんなを遠ざけ、携帯電話に話し掛けた。変換された文字列は
「みんな馬鹿です」。
AVG anti-virus data base out of date
Re:打つ方が早い (スコア:2, すばらしい洞察)
キーボードだと僕もそう思いますが、携帯のテンキー(ダイヤルボタン)での入力では、そうも行かないのでは?
いや携帯型キーボード [nikkei.co.jp] なんてものもあるので、皆さん早いのかな?
Re:打つ方が早い (スコア:1)
v@v
Re:話した言葉も検索対象に (スコア:1)
はてな日記 [hatena.ne.jp]継続ちう
Re:話した言葉も検索対象に (スコア:1)