パスワードを忘れた? アカウント作成
14631 story

Vistaの音声認識でPerlのコードを書く試み 124

ストーリー by yoosee
正規表現とか気が狂いそうだ 部門より

あるAnonymous Coward 曰く、

むアンテナからたどり着いたのだが、Youtube に Windows Vistaの音声認識を使ってPerlのコードを書くという動画がある。 この奮闘ぶりには思わず笑ってしまうのだが、近い将来、コードを喋りまくるハッカーが出現したり するだろうかとか思ってしまった。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2007年02月14日 9時49分 (#1109764)
    文字列変数にここのサイト名を入力する作業
  • Lispだったら (スコア:4, おもしろおかしい)

    by Anonymous Coward on 2007年02月14日 9時51分 (#1109767)
    かっこ、かっこ、かっこ、....、こっか、こっか、ああ、ひとつ足りない。
  • 序盤だけ適当訳 (スコア:4, おもしろおかしい)

    by pluto (24933) on 2007年02月14日 14時08分 (#1109931) 日記
    単語を認識できるならいけるんじゃないかと最初は思いましたが
    一分後にやっぱり素直にタイプしたほうが楽だと思いました。

    序盤だけ適当に訳した。「:」より右が画面の様子。長文スマソ。
    「メモ帳開け、最大化」:メモ帳が開いて最大化
    「オープンとかっこ」:Open (
    「行頭へ、削除」:pen (
    「オー、オーを押せ」:open (
    「行末へ」:open (|
    「CAPSを押せ」
    「インフォ」:open (info
    「インフォを削除」:open (
    「CAPSを押せ。CAPSを押せ」
    「インフォ!」:open (info
    「イ、インフォを削除」:open (
    「大文字のiを押せ」:open (i
    「iを削除」:open (
    「大文字のiを押せ」:open (i
    「iを削除!」:open (
    「お・お・も・じ・の・あ・い・を・お・せ」:open (i
    「・・・チッ」
    「(ため息)CAPSを押せ」:open (i scrolls caps conflict
    「CAPSを押せ」:open (i scrolls caps conflict
    「i scrolls caps conflictを削除」:open (
    • by taka2 (14791) on 2007年02月14日 14時56分 (#1109959) ホームページ 日記
      最終的なコードは
      open(INFO, '-');
      @input = <INFO >;
      close (INFO);
      ($string, $times) =@input;
      print $string x $times;
      ってものでしたが、結局全部大文字の「INFO」を入力することはできず、
      諦めてキーボードで入力してましたね。見ていて、入力者がだんだん苛立ってくるのがよくわかる…

      途中からは、
      「Close」と誤入力されたのに対し「correct close」→候補一覧が出る→「one」→1番目の候補の「close」に訂正
      みたいに修正するようになって、それでだいぶ入力効率が良くなってた感じ。

      でも、これを見てると、スピーカから鳴らした音声で強制シャットダウン [srad.jp]なんて、まだまだ夢物語だと思いました。
      親コメント
  • by Livingdead (18685) on 2007年02月14日 9時24分 (#1109749) ホームページ 日記
    非可聴つぶやき声で音声認識 [srad.jp]」で取り上げられているようなつぶやき(Non-Audible Murmur, NAM)だと実用的かもしれない。「ステューディオ。エイチ。」などとぶつぶつつぶやくプログラマ・・・あれ?隣にすでにいるような気がする・・・・
    --
    屍体メモ [windy.cx]
    • by Anonymous Coward on 2007年02月14日 14時15分 (#1109935)
      昔OS/2 Warp4で試した。

      「シャープ アイ エヌ...」とかやりながら、結構文字ちゃんと入るな~、と思うじゃないですか。
      すると油断が音声にでるのかだんだん入らなくなってくるわけです。
      次にどうなるかというと、「いや、そうじゃなくて」とか思わず声にでちゃうわけです。
      すると画面にですね。
      「嫌そうじゃなくて」とか出てきやがって結構へこみます。

      ちなみに画面見ずに本を朗読すると結構な認識率になったような覚えもあります。

      #久々に思い出したよ。
      #端から見てると馬鹿に見えるってことも
      親コメント
    • by Nomad-AY (2520) on 2007年02月14日 9時34分 (#1109757) ホームページ
      >「ステューディオ。エイチ。」などとぶつぶつつぶやくプログラマ・・・あれ?隣にすでにいるような気がする・・・・

      「シャーピンクルデ、スタジオ・エッチ」とかつぶやく人なら居ます ;-)
      #基本がローマ字読み
      --
      タブレット中毒者。
      親コメント
  • えっと、 (スコア:3, おもしろおかしい)

    by Anonymous Coward on 2007年02月14日 9時26分 (#1109751)
    「声に出して読みたい」コードになりますでしょうか!?

    #元某編集長さんのネタいただきました
  • by marute (13883) on 2007年02月14日 9時33分 (#1109755) 日記
    ヌル派 vs ナル派
  • 脆弱性 (スコア:3, 参考になる)

    by Anonymous Coward on 2007年02月14日 9時41分 (#1109760)
    ソースコードの場合、効率の悪さから実際に導入する人は少ないでしょうが…

    昔、音声認識ソフトのデモで、エクセルに数字を入力したり、
    ワードに社内文書を入力しているビデオがありました。
    特に、周囲に人がいる所で使うのは躊躇われるという突込みを
    先回りしてか重役室っぽいところで行っておりましたが、
    内心「簡単な盗聴器で秘密が筒抜けだなあ」とか心配になったものです。
    もっとも、ピーターの法則により重役室で重要なデータが入力される事は無く
    そのような心配は必要ないのかもしれませんが!?

    でも、永田メールみたいに重要な証拠になる例があるから油断は禁物でしょう。

    #まあガセだったわけだが
    • by masakun (31656) on 2007年02月14日 10時30分 (#1109794) 日記
      >ソースコードの場合、効率の悪さから実際に導入する人は少ないでしょう

      1996年にリリースされたOS/2Warp4.0に音声認識が初めて搭載されたとき、OS/2Magazine誌に掲載された
      IBMの副社長さんへのインタビュー記事で「病院のカルテ書きに音声認識が使われていて効率が上がった」という話が
      書いてあった記憶があります。たしか両手がふさがっていても筆記できるからという理由だったと思います。

      どうせ音声認識のデモならそういうシチュエーションのものの方が分かりやすいと思いますけどね。

      そそ余談ですが、Warp4.0のデモで来日したデビッド・バーンズ氏 [wincons.or.jp]へのインタビュー記事で、飛行機内で、
      自分のOS/2マシンに音声認識で語りかけてデスクトップを操作しはじめる(ワークプレイスシェルのすべてのオブジェクトが
      音声認識で操作可能だった)と、周りでソリティアをやっていた人たちが自分のPCをしまいはじめたという逸話も面白かった
      です。

      それで10年前のOS/2でできたことが、ようやくWindowsでもできるようになったんですね(違
      --
      モデレータは基本役立たずなの気にしてないよ
      親コメント
      • by Anonymous Coward on 2007年02月14日 11時21分 (#1109819)
        >「病院のカルテ書きに音声認識が使われていて効率が上がった」
        そもそも口述筆記とまではいかなくとも、ある程度周囲に情報が漏れる事は想定される
        という特徴はありますが、最初に本人に知らせるかどうか躊躇われるようなシビアな病気の時には微妙?
        そうでなくても、聴診器をあてている先生がブツブツとカルテ入力をする
        (しかも日本語ではない)というのはちょっと慣れが必要かもしれない。
        ま、私が件のビデオを見たのはXPが出るちょっと前なので7年前のことですが、
        電子カルテに記入するというシチュエーションは一般的ではなかったという事で、
        あってもビデオを作る市場規模ではなかったでしょう日本では。

        個人的にはICレコーダ/テープ起こしに使えたら、社長スピーチの原稿化に助かるのですが、
        所詮は特定個人に特化した学習データベース、最適なレベルで入力される事が前提で、
        入力者が意識しなければ機能しないレベル/環境では普及は見込めるはずも無いですが。
        ただ、テレビ局の字幕放送に音声認識が補助的に使用されているとか聞いたことがあるので、
        金に糸目をつけなければ辞書無しで精度の高い製品もあるのかもしれませんね。

        ただ、どんなに適したシチュエーションと製品でもアプリケーションの操作まで
        口頭で入力しようとする限り人間にとっての不自然さは解消されてない訳で、
        もともと両手がふさがっていようがいまいがソレ以外に入力手段が無いならともかく、
        本来はキーボードで使うシステムを音声化しても、最短で入力できる方法を知っているので、
        入力/推敲の手間、入力に要する注意が増加して却って煩わしく感じるパラドクス。
        両手が塞がれない代わりに思考(試行?)を塞がれては本末転倒ですね。
        多くの人は両手が自由に出来る状態を作って書くという選択を取るでしょうね。
        親コメント
  • 部門名 (スコア:3, おもしろおかしい)

    by Anonymous Coward on 2007年02月14日 11時48分 (#1109834)
    「高度に練りあげた正規表現は呪文 [geocities.com]と区別がつかない」と言ったのはどのACさんでしたっけ。
    • Re:部門名 (スコア:4, おもしろおかしい)

      by Anonymous Coward on 2007年02月14日 12時35分 (#1109870)
      /http\:\/\/slashdot\.jp\//

      すらっしゅえいちてぃーてぃーぴーばっくすらっしゅころんばっくすらっしゅすらっしゅばっくすらっしゅすらっしゅすらっしゅどっとばっくすらっしゅどっとじぇいぴーばっくすらっしゅすらっしゅすらっしゅ

      # と喋っても元の文字列にならないと思うのでAC
      親コメント
  • 音声グラフィティ (スコア:3, すばらしい洞察)

    by Anonymous Coward on 2007年02月14日 16時32分 (#1110016)
    自然音声を認識させようとするから難しいのではないだろうか、とふと思った。

    AppleのNewtonMessagePadは当初手書き文字の認識率と認識速度に悩まされた製品だったが、
    PalmPilotは簡略化された記号を入力することで認識率と速度を上げた「Graffiti」で
    これを克服した。

    だから、「話したとおり入力」じゃなくて、人間サマのほうが「簡略言語」で話して
    それを認識・入力すればいけるのではないか?と。

    #でも、傍からはどう見ても「意味不明のことを口走る変人」にしか見えないので製品化は困難。
     「ほげふが、ふが、ぴよ、ぬるぽ、がっ!」→なんかすごいスクリプトが生成されるとか。
  • by Anonymous Coward on 2007年02月14日 11時22分 (#1109820)
    COBOL
  • by sakamoto (8009) on 2007年02月14日 11時45分 (#1109833) 日記
    万が一文化的に浸透してしまうと、逆に日常会話に影響が出たりしてね。 単語の間に space を必ず入れてしまうとか。
    --
    -- 哀れな日本人専用(sorry Japanese only) --
  • by hatoya4126 (9326) on 2007年02月14日 12時18分 (#1109856) 日記
    こんなのも開かれていたことだし。

    ActiveState Perl Haiku Contest
    http://aspn.activestate.com/ASPN/Perl/Haiku/InPerl [activestate.com]
  • by AIMTDL (22183) on 2007年02月14日 15時28分 (#1109981)

    つづりをかいし

    といえば、一文字づつ入力できますよ。
    英語の場合は英語でどうぞ。

  • 朝の風物詩 (スコア:1, おもしろおかしい)

    by Anonymous Coward on 2007年02月14日 9時56分 (#1109772)
    工場では朝の体操が風物詩ですが、同様に事務所では朝の発声練習が風物詩となる、んでしょうか? #あめんぼあかいなアイウエオ・・・
  • by 127.0.0.1 (33105) on 2007年02月14日 10時08分 (#1109783) 日記
    一々コードをしゃべるのもかったるくて頭悪いから、
    考えただけでコードが出力されるシステムを誰か作ってほしい。

    #とか書くと、何も考えなくてもいいシステムの方がとか言われそうだな
    • by Ryo.F (3896) on 2007年02月14日 11時13分 (#1109816) 日記
      考えただけでコードが出力されるシステム
      で、出来上がるコードはエロゲ、と。
      親コメント
    • by gauchez (7240) on 2007年02月14日 11時51分 (#1109839)
      ロシア語で考えないと認識されないぞっと。
      親コメント
    • 脳直結 (スコア:1, 興味深い)

      by Anonymous Coward on 2007年02月14日 12時42分 (#1109875)
      脳にチップ埋め込んで入力インターフェースとする研究はされているから そのうちキーボードぐらい繋げるようになるよ。
      脳でキーボード操作できるようになるにはタッチタイピングの練習のように 訓練が必要になると思うけど。
      親コメント
      • Re:脳直結 (スコア:2, おもしろおかしい)

        by USH (8040) on 2007年02月14日 13時30分 (#1109910) 日記
        ほんでもって、その練習用にゴルゴ13とかガンダムとか萌え系を題材にした練習ソフトが発売されるのでしょうか? 

        それが出回ったころ、今度はそれと連動した(考えただけで入力できる)ゲームがPS3とXBOX360で発売されます。

        Wiiは対抗して、考えただけでコントローラを振り回わしたことになるインターフェースを発売します。これで、コントローラを投げ飛ばしてもテレビが壊れることはなくなります。
        親コメント
  • by sameshima (10060) on 2007年02月14日 10時10分 (#1109784) 日記
    見始めてdeleteできるなら使えるじゃんと思い
    冬にコタツに手を入れたままコーディングできるとか考えながら
    最後までみましたがとんでもないですね。

    cat > that_was_easy.txt

    のほうが楽だ
  • by arkas (10211) on 2007年02月14日 11時12分 (#1109814) 日記
    音声認識フレンドリーな言語を考える番ですね(←無粋?)。

    とりあえず、日本語プログラミング言語MIND [airnet.ne.jp]。
  • by Anonymous Coward on 2007年02月14日 11時37分 (#1109826)
    ブレードランナーでデッカードが画像解析していたシーン。
    あんなカンジでいけませんかね?

    「fooクラスを表示」
    「下スクロール…ストップ」
  • 数年前に、ちょっとした事故で手が使えない(キーボードが打てない)ことがあり、そのとき「何とかならんのか」と思い悩んだことがありました。
    Win2kにIBM製の音声認識ソフトを入れて試しましたが、認識速度と誤認識の多さから断念しました。

    個人的には、音声認識によって利用できるプログラミング環境は欲しいですね。
    どなたかこういうので成功したとか、実用になった方っていらっしゃいますか?
    --
    alp-w
    • by glasstic (32934) on 2007年02月15日 0時04分 (#1110211) 日記
      5年以上前のMMORPGで、同じくIBMの音声入力ソフトを使って遊んだのを思い出しました。

      初めはチャットを音声入力で代用して、戦闘をキーで行おうとしたのですが、
      当時の音声入力は文章単位で入力するのはとても無理でした。
      そこで、チャットはキーで行って、戦闘の補助(マクロの使用)を音声入力で行ってみました。
      「ファイア!」
      と叫ぶと魔法が発動するのは、なかなか爽快でしたね。
      まぁ、当時は音声入力の変換も遅くて、実用にはなりませんでしたが、
      OFF会で実演したら大ウケでした。

      #成功というのかな?
      親コメント
  • by kkumon (20396) on 2007年02月14日 12時56分 (#1109885)
    喋った文章を解析して適切なコードを書いてくれるなんて当面無理ですかね。
    それよりも対話できるコンピュータの方が望まれているかもしれませんが。
    • Re:音声認識なら (スコア:3, おもしろおかしい)

      by Anonymous Coward on 2007年02月14日 13時27分 (#1109907)
      >対話できるコンピュータ

      プログラマ「~とまぁ、こういう仕様なんだけど」
      コンピュータ「…難しいですね。スケジュールは?」
      プログラマ「月曜の朝イチにレビュー」
      コンピュータ「無理です。最低でも一週間かかります。調整して下さい。」
      プログラマ「判った…。リーダーに相談してみるよ」

      こんなカンジでしょうか?w
      親コメント
    • Re:音声認識なら (スコア:2, すばらしい洞察)

      by Anonymous Coward on 2007年02月14日 15時58分 (#1110002)
      > 喋った文章を解析して適切なコードを書いてくれるなんて当面無理ですかね。

      それ,あなたの仕事じゃないの?
      親コメント
  • ペンをあげろ
  • by epsilon-minder (32074) < > on 2007年02月14日 13時02分 (#1109891) 日記
    本当に魔法使いになってしまうわけですね。
    杖とか持って。

    #そんな奴はキー叩くだろというツッコミはかなり正しい
typodupeerror

物事のやり方は一つではない -- Perlな人

読み込み中...