Vistaの音声認識でPerlのコードを書く試み 124
ストーリー by yoosee
正規表現とか気が狂いそうだ 部門より
正規表現とか気が狂いそうだ 部門より
あるAnonymous Coward 曰く、
むアンテナからたどり着いたのだが、Youtube に Windows Vistaの音声認識を使ってPerlのコードを書くという動画がある。 この奮闘ぶりには思わず笑ってしまうのだが、近い将来、コードを喋りまくるハッカーが出現したり するだろうかとか思ってしまった。
これを言わなくてどーする (スコア:5, おもしろおかしい)
Lispだったら (スコア:4, おもしろおかしい)
昔のテープみたいに (スコア:2, おもしろおかしい)
序盤だけ適当訳 (スコア:4, おもしろおかしい)
一分後にやっぱり素直にタイプしたほうが楽だと思いました。
序盤だけ適当に訳した。「:」より右が画面の様子。長文スマソ。
「メモ帳開け、最大化」:メモ帳が開いて最大化
「オープンとかっこ」:Open (
「行頭へ、削除」:pen (
「オー、オーを押せ」:open (
「行末へ」:open (|
「CAPSを押せ」
「インフォ」:open (info
「インフォを削除」:open (
「CAPSを押せ。CAPSを押せ」
「インフォ!」:open (info
「イ、インフォを削除」:open (
「大文字のiを押せ」:open (i
「iを削除」:open (
「大文字のiを押せ」:open (i
「iを削除!」:open (
「お・お・も・じ・の・あ・い・を・お・せ」:open (i
「・・・チッ」
「(ため息)CAPSを押せ」:open (i scrolls caps conflict
「CAPSを押せ」:open (i scrolls caps conflict
「i scrolls caps conflictを削除」:open (
Re:序盤だけ適当訳 (スコア:2, 参考になる)
諦めてキーボードで入力してましたね。見ていて、入力者がだんだん苛立ってくるのがよくわかる…
途中からは、
「Close」と誤入力されたのに対し「correct close」→候補一覧が出る→「one」→1番目の候補の「close」に訂正
みたいに修正するようになって、それでだいぶ入力効率が良くなってた感じ。
でも、これを見てると、スピーカから鳴らした音声で強制シャットダウン [srad.jp]なんて、まだまだ夢物語だと思いました。
非可聴つぶやき声で音声認識 (スコア:3, おもしろおかしい)
屍体メモ [windy.cx]
Re:非可聴つぶやき声で音声認識 (スコア:4, おもしろおかしい)
「シャープ アイ エヌ...」とかやりながら、結構文字ちゃんと入るな~、と思うじゃないですか。
すると油断が音声にでるのかだんだん入らなくなってくるわけです。
次にどうなるかというと、「いや、そうじゃなくて」とか思わず声にでちゃうわけです。
すると画面にですね。
「嫌そうじゃなくて」とか出てきやがって結構へこみます。
ちなみに画面見ずに本を朗読すると結構な認識率になったような覚えもあります。
#久々に思い出したよ。
#端から見てると馬鹿に見えるってことも
Re:非可聴つぶやき声で音声認識 (スコア:2, おもしろおかしい)
「シャーピンクルデ、スタジオ・エッチ」とかつぶやく人なら居ます ;-)
#基本がローマ字読み
タブレット中毒者。
えっと、 (スコア:3, おもしろおかしい)
#元某編集長さんのネタいただきました
Re:えっと、 (スコア:2, おもしろおかしい)
Re:えっと、 (スコア:3, すばらしい洞察)
/* Kachou Utumi
I'm Not Rich... */
nullを巡る不毛な対立が勃発 (スコア:3, すばらしい洞察)
脆弱性 (スコア:3, 参考になる)
昔、音声認識ソフトのデモで、エクセルに数字を入力したり、
ワードに社内文書を入力しているビデオがありました。
特に、周囲に人がいる所で使うのは躊躇われるという突込みを
先回りしてか重役室っぽいところで行っておりましたが、
内心「簡単な盗聴器で秘密が筒抜けだなあ」とか心配になったものです。
もっとも、ピーターの法則により重役室で重要なデータが入力される事は無く
そのような心配は必要ないのかもしれませんが!?
でも、永田メールみたいに重要な証拠になる例があるから油断は禁物でしょう。
#まあガセだったわけだが
効率のよい音声認識活用例 (スコア:3, 興味深い)
1996年にリリースされたOS/2Warp4.0に音声認識が初めて搭載されたとき、OS/2Magazine誌に掲載された
IBMの副社長さんへのインタビュー記事で「病院のカルテ書きに音声認識が使われていて効率が上がった」という話が
書いてあった記憶があります。たしか両手がふさがっていても筆記できるからという理由だったと思います。
どうせ音声認識のデモならそういうシチュエーションのものの方が分かりやすいと思いますけどね。
そそ余談ですが、Warp4.0のデモで来日したデビッド・バーンズ氏 [wincons.or.jp]へのインタビュー記事で、飛行機内で、
自分のOS/2マシンに音声認識で語りかけてデスクトップを操作しはじめる(ワークプレイスシェルのすべてのオブジェクトが
音声認識で操作可能だった)と、周りでソリティアをやっていた人たちが自分のPCをしまいはじめたという逸話も面白かった
です。
それで10年前のOS/2でできたことが、ようやくWindowsでもできるようになったんですね(違
モデレータは基本役立たずなの気にしてないよ
Re:効率のよい音声認識活用例 (スコア:1, すばらしい洞察)
そもそも口述筆記とまではいかなくとも、ある程度周囲に情報が漏れる事は想定される
という特徴はありますが、最初に本人に知らせるかどうか躊躇われるようなシビアな病気の時には微妙?
そうでなくても、聴診器をあてている先生がブツブツとカルテ入力をする
(しかも日本語ではない)というのはちょっと慣れが必要かもしれない。
ま、私が件のビデオを見たのはXPが出るちょっと前なので7年前のことですが、
電子カルテに記入するというシチュエーションは一般的ではなかったという事で、
あってもビデオを作る市場規模ではなかったでしょう日本では。
個人的にはICレコーダ/テープ起こしに使えたら、社長スピーチの原稿化に助かるのですが、
所詮は特定個人に特化した学習データベース、最適なレベルで入力される事が前提で、
入力者が意識しなければ機能しないレベル/環境では普及は見込めるはずも無いですが。
ただ、テレビ局の字幕放送に音声認識が補助的に使用されているとか聞いたことがあるので、
金に糸目をつけなければ辞書無しで精度の高い製品もあるのかもしれませんね。
ただ、どんなに適したシチュエーションと製品でもアプリケーションの操作まで
口頭で入力しようとする限り人間にとっての不自然さは解消されてない訳で、
もともと両手がふさがっていようがいまいがソレ以外に入力手段が無いならともかく、
本来はキーボードで使うシステムを音声化しても、最短で入力できる方法を知っているので、
入力/推敲の手間、入力に要する注意が増加して却って煩わしく感じるパラドクス。
両手が塞がれない代わりに思考(試行?)を塞がれては本末転倒ですね。
多くの人は両手が自由に出来る状態を作って書くという選択を取るでしょうね。
部門名 (スコア:3, おもしろおかしい)
Re:部門名 (スコア:4, おもしろおかしい)
すらっしゅえいちてぃーてぃーぴーばっくすらっしゅころんばっくすらっしゅすらっしゅばっくすらっしゅすらっしゅすらっしゅどっとばっくすらっしゅどっとじぇいぴーばっくすらっしゅすらっしゅすらっしゅ
# と喋っても元の文字列にならないと思うのでAC
音声グラフィティ (スコア:3, すばらしい洞察)
AppleのNewtonMessagePadは当初手書き文字の認識率と認識速度に悩まされた製品だったが、
PalmPilotは簡略化された記号を入力することで認識率と速度を上げた「Graffiti」で
これを克服した。
だから、「話したとおり入力」じゃなくて、人間サマのほうが「簡略言語」で話して
それを認識・入力すればいけるのではないか?と。
#でも、傍からはどう見ても「意味不明のことを口走る変人」にしか見えないので製品化は困難。
「ほげふが、ふが、ぴよ、ぬるぽ、がっ!」→なんかすごいスクリプトが生成されるとか。
21世紀を見据えて作られた言語 (スコア:2, おもしろおかしい)
近頃の若者の言葉はなっとらん (スコア:2, おもしろおかしい)
-- 哀れな日本人専用(sorry Japanese only) --
Re:近頃の若者の言葉はなっとらん (スコア:2, おもしろおかしい)
I'm out of my mind, but feel free to leave a comment.
Re:近頃の若者の言葉はなっとらん (スコア:1)
"t"
とか?
まずは俳句で練習だ (スコア:2, 興味深い)
ActiveState Perl Haiku Contest
http://aspn.activestate.com/ASPN/Perl/Haiku/InPerl [activestate.com]
イラついているようですが (スコア:2, 参考になる)
つづりをかいし
といえば、一文字づつ入力できますよ。
英語の場合は英語でどうぞ。
朝の風物詩 (スコア:1, おもしろおかしい)
かったるい (スコア:1)
考えただけでコードが出力されるシステムを誰か作ってほしい。
#とか書くと、何も考えなくてもいいシステムの方がとか言われそうだな
Re:かったるい (スコア:1)
Re:かったるい (スコア:4, おもしろおかしい)
二次元かよ!!
Re:かったるい (スコア:1)
脳直結 (スコア:1, 興味深い)
脳でキーボード操作できるようになるにはタッチタイピングの練習のように 訓練が必要になると思うけど。
Re:脳直結 (スコア:2, おもしろおかしい)
それが出回ったころ、今度はそれと連動した(考えただけで入力できる)ゲームがPS3とXBOX360で発売されます。
Wiiは対抗して、考えただけでコントローラを振り回わしたことになるインターフェースを発売します。これで、コントローラを投げ飛ばしてもテレビが壊れることはなくなります。
寒さ対策 (スコア:1)
冬にコタツに手を入れたままコーディングできるとか考えながら
最後までみましたがとんでもないですね。
cat > that_was_easy.txt
のほうが楽だ
Re:寒さ対策 (スコア:1, おもしろおかしい)
キーボードをコタツの中に入れてやるのはどうですか?
タッチタイピング{の練習になる|出来るなら無問題}
実際にやると (スコア:2, おもしろおかしい)
経験者談
Re:実際にやると (スコア:3, おもしろおかしい)
次は (スコア:1)
とりあえず、日本語プログラミング言語MIND [airnet.ne.jp]。
デバッガ或いは解析ツール (スコア:1, 興味深い)
あんなカンジでいけませんかね?
「fooクラスを表示」
「下スクロール…ストップ」
Re:デバッガ或いは解析ツール (スコア:1, すばらしい洞察)
音声認識でプログラミング (スコア:1)
Win2kにIBM製の音声認識ソフトを入れて試しましたが、認識速度と誤認識の多さから断念しました。
個人的には、音声認識によって利用できるプログラミング環境は欲しいですね。
どなたかこういうので成功したとか、実用になった方っていらっしゃいますか?
alp-w
Re:音声認識でプログラミング (スコア:2, 興味深い)
初めはチャットを音声入力で代用して、戦闘をキーで行おうとしたのですが、
当時の音声入力は文章単位で入力するのはとても無理でした。
そこで、チャットはキーで行って、戦闘の補助(マクロの使用)を音声入力で行ってみました。
「ファイア!」
と叫ぶと魔法が発動するのは、なかなか爽快でしたね。
まぁ、当時は音声入力の変換も遅くて、実用にはなりませんでしたが、
OFF会で実演したら大ウケでした。
#成功というのかな?
音声認識なら (スコア:1)
それよりも対話できるコンピュータの方が望まれているかもしれませんが。
Re:音声認識なら (スコア:3, おもしろおかしい)
プログラマ「~とまぁ、こういう仕様なんだけど」
コンピュータ「…難しいですね。スケジュールは?」
プログラマ「月曜の朝イチにレビュー」
コンピュータ「無理です。最低でも一週間かかります。調整して下さい。」
プログラマ「判った…。リーダーに相談してみるよ」
こんなカンジでしょうか?w
Re:音声認識なら (スコア:2, すばらしい洞察)
それ,あなたの仕事じゃないの?
ここでLOGOの登場ですよ (スコア:1)
つまりWizardが (スコア:1)
杖とか持って。
#そんな奴はキー叩くだろというツッコミはかなり正しい
Re:そのうち日本で(というか2chで) (スコア:1, おもしろおかしい)
Re:そのうち日本で(というか2chで) (スコア:3, おもしろおかしい)
#でもキータッチ音は静音設計じゃないとね(^^;
タブレット中毒者。
Re:そのうち日本で(というか2chで) (スコア:1)
「く」ばっかり叩いてる人は!?
#「エイチ」と読むような無粋なキーボードは要りません
Re:機械語 (スコア:1)
音だけではひらがな/カタカナは解らんし、同音異義語は大量に有るし、文章内に平気で別言語の単語とか挿入しちゃうし。
数字だって外来のアラビア数字が下手すると漢数字以上に標準ってツラしているし。
Re:おっしゃ! (スコア:4, おもしろおかしい)
バッファオーバーフローが心配で心配でエロゲどころじゃないかと。
1を聞いて0を知れ!