パスワードを忘れた? アカウント作成
302095 story
人工知能

会話ができるコンピュータがあったら嬉しい ? それとも怖い ? 95

ストーリー by reo
ボウマン、やめて…ボウマン 部門より

capra 曰く、

本家 /. 記事「Talking To Computers?」より。

コンピュータに話しかけるのは不自然だろうか ? 米人気クイズ番組の Jeopardy に出演したコンピュータについて幾人かの同僚と話したところ、コンピュータに話しかけて、それに応じた答えが音声で返ってくることは幾分か「恐怖」を感じる状況のようだ。同様に感じる人は多いのだろうか ?

自分の場合は、コンピュータにどのプログラムを開きたいか口頭で伝えら得られたらどんなに良いだろうかと考えているのだが、同意を多く得られる訳ではないようで驚いている。

コンピュータを罵倒するわけではなく、普通に話しかけ返事もらいたいというのはそんなに受け入れられないものなのだろうか ? Jeopardy で活躍した Watson のようなコンピュータを作りたいと思う人は自分以外にもいるのか、それとも恐怖を感じる人の方が多いのだろうか。

Jeopardy で圧勝したという Watson (/.J 記事) については IBM の公式サイトに詳しい。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by masakun (31656) on 2011年02月26日 4時36分 (#1908609) 日記

    >自分の場合は、コンピュータにどのプログラムを開きたいか口頭で伝えら得られたらどんなに良いだろうかと考えているのだが、

    Dragon Naturally Speaking 2005 デモ [nuance.com]

    音声認識ソフトをセットアップすればよい。Windows Vista [microsoft.com]やWindows 7 [microsoft.com]には音声認識機能が標準搭載されているみたいだけど。かつては IBM ViaVoice なんて製品もあったが、昨年サポートを終了 [nuance.com]しているのか。使っている人を見る機会もないので、音声でパソコン操作するニーズは一般にはないのかもね。

    そういや OS/2Warp4 にも Voiceナビゲーション機能(日本語)が追加インストールできたけれど、モノ珍しさで使ったのは最初の数回だったな。eComStation2 に入れて久しぶりに遊んでみるか。

    【関連ストーリー】Vistaの音声認識でPerlのコードを書く試み [srad.jp]

    • 残念ながら音声認識ソフトをセットアップすればよい、という簡単な話ではない。現状の音声認識技術では人間が簡単にやっているような会話認識は無理。単語の認識率を向上させるためには辞書のチューンが必須で、使用者に合わせて学習させる等の手間がかかる。人間が音声認識ソフトが認識しやすいように気を配る必要があるし、何か仕事をさせるためには辞書に登録された「音声コマンド」を使って命じなければいけない。 コンピュータに自然に話しかけるというレベルには程遠く、自分の手を動かして操作したほうがストレス無く出来る。カーナビやモバイル端末で音声認識が使われているのは、手がふさがっていたり、キーボードが無い状況で便利だからだろう。 スタートレックのように、人間の会話を認識できるコンピュータはいつ実現できるやら・・・
      親コメント
      • >人間が簡単にやっているような会話認識は無理。

        A:「あれどう?」
        B:「きびしいね」

        ってな会話は人間相手でも、相手(との関係や経験)によりけりで認識は無理ですね。

        #こういう「曖昧な」会話は苦手な事が多い。

        親コメント
  • by slee (1360) on 2011年02月28日 17時56分 (#1909901)

    確か以前SunOSに音声デバイスが誰でもアクセスできるパミッション問題があって、リモートユーザーがそれを利用してマイクをアクセスしてワークステーションのある場所を盗聴できたり、不気味な音声を再生してワークステーション前の人脅かしたりことはできていた、という話は聞いたことあります。故に現在のLinuxディストリビューションはいろいろ工夫して音声デバイスのアクセス権をコンソールユーザーにしか与えないようにしているし、個人的に常時マイクを入れることに抵抗感があります。

    ネット接続パソコンに常時オンしてるマイクを使うのは、もしマルウェアが入ったら盗聴器が仕掛けられた同様というリスクが負うことも考えなくてはならないかもしれないね。

  • 多分イライラしてくるでしょう。
    こっちが期待する答をちゃんと返してくれるはずがない訳で。

    例えばどこかへ行く経路を調べさせた時、今のwebサービスのようにずらずらと情報を喋ってくれたら何のことやら訳がわからないだけでしょう。人間は画面に表示されている情報から、自分が必要な情報のみピックアップしています。それをコンピュータにやらせるのはかなり難しいのではないかと。

    --
    --- de FTNS.
  • (客観的に見ると)コンピュータに話しかけてる自分が怖い…

  • by Lurch (10536) on 2011年02月28日 12時02分 (#1909645)
    音声入出力が自然ですね。
    個人的には、画面等に向かって喋るのではなく、人型の何かに向かって喋る方が良いかな。
    マニュピレーターで作業の手伝いもしてくれると便利だと思う
    --

    ------------
    惑星ケイロンまであと何マイル?
    • by TarZ (28055) on 2011年02月28日 12時29分 (#1909670) 日記

      23世紀SF的に、マウスに向かって「コンピューター?」とか話しかけることもあるかもしれませんが、気持ち悪いとか以前に不便じゃないですか?

      普段からキーボードを多用しているような人なら、話すよりキータイプしたほうが早い、という人は珍しくない(というよりおそらく多数派)ですよね。また、人の話を聴くより文字を読むほうが早い。会話型インターフェイスだと時間がかかって仕方がない。

      ただ、UIがキーボード&ディスプレイの場合は両手と視覚がふさがってしまう欠点はあります。クルマの運転中のようにハンズフリーで視覚情報を妨げない使い方が求められるなら、会話型コンピュータもありかもしれません。(って、カーナビがそうか)

      親コメント
      • by Lurch (10536) on 2011年02月28日 12時40分 (#1909680)
        人の進化の過程で、話し言葉が出来てから数千(万?)年後に、書き言葉が出来たので、話し言葉の方がUIとして優れているとかいないとか^^;
        おっしゃるように、読むことや書くことに集中してると、聞く話すより密度が高いような気がします。
        それは練習の成果らしいですので、UIが選べるとどうなるか判りません。
        --

        ------------
        惑星ケイロンまであと何マイル?
        親コメント
        • by BIWYFI (11941) on 2011年02月28日 14時04分 (#1909754) 日記

          確かに、話し言葉の方がUI的に優れてる感は在るかも。
          例えば、PC操作の上手い人に「これやっといてね」で、作業が済む訳で。

          でも、操作の拙い人相手に、言葉だけで操作を説明する苦労を考えると、現状じゃ到底便利とは思えないんだが。

          あと、現状GUIだと、「見つけた物」をクリックすれば動作する仕様なんで、「見て探す」機能の代替品が無いと、UIとして成立しないかと。
          字幕映画が成立する様に、黙読速度は聞くよりも圧倒的に速くて(外国語を除く)、それに「流し読み」が加わると、聴覚的な情報じゃ全然追いつかないのが実情。
          視線トレースマウスと併用で、「それ開いて」で済めば、多分使える様な気はするけど、長ったらしいファイル名やURLを言わされるUIじゃ、全然便利に思えない。

          それから、別スレのコメントに在ったが、「あれこれそれ」で、適確に指示出来ないと困るんだけど、現状だと文脈で理解はしてくれないんだよね。
          で、それが実現出来るUIだと、多分、キーが2,3個有るだけで大抵の操作が出来る様なUIになってる気がする。
          今でも、そこそこ賢いUIで、調子が良い時は、OK押すだけで、結構使える事が多いし。

          現状で一番の問題は、UIが予想を外した時に、正しく指示するのが果てしなく面倒な点かと。
          要は、そもそも、現状UIの頭の悪さをなんとかしないとって事で。

          --
          -- Buy It When You Found It --
          親コメント
        • by Lurch (10536) on 2011年02月28日 12時43分 (#1909682)
          追記

          マウスに話しかける感じじゃなくて、
          ロボットじゃないよアンドロイドだよな感じの秘書が助けてくれる感じかな~
          --

          ------------
          惑星ケイロンまであと何マイル?
          親コメント
      • by nemui4 (20313) on 2011年02月28日 14時02分 (#1909751) 日記

        >23世紀SF的に、マウスに向かって「コンピューター?」とか話しかけることもあるかもしれませんが、気持ち悪いとか以前に不便じゃないですか?

        たぶんその頃でもSF的にでも「マウス」に向かって話しかけるUIはあんまり無いと思う。
        もし貴方がバロットかボイルドなら、「ウフコック」には話しかけるかもしれないけど。

        マウスに向かって「左上3cmクリック、右下5cmまでドラッグ、リリース、遅い、行き過ぎた!」とか命令するのは面白いかも。
        #すんげー不便そう。

        親コメント
        • by SteppingWind (2654) on 2011年02月28日 15時18分 (#1909801)

          マウスに向かって「左上3cmクリック、右下5cmまでドラッグ、リリース、遅い、行き過ぎた!」とか命令するのは面白いかも。

          ほぼ同様の操作を, 映画「ブレードランナー」の中でやっているシーンがありますけど, 酒かっくらいながらのような余裕のある時でもなければ使えないという気がします. 特定用途向けで単語の羅列のみで操作できる現実的なインターフェイスだけど, 30年後の今の視点だと, ホイール付マウスを使ったほうが明らかに楽そう.

          親コメント
          • by nemui4 (20313) on 2011年02月28日 15時26分 (#1909805) 日記

            往年のAh!SKIで「自動JOY STICK」だか言うのを作ってたのを思い出した。

            他人のマウスをこっそり自走マウスと入れ替えて反応を見るというドッキリがあったら微妙に面白そう。

            親コメント
      • たしかに、マリーン風に...
        ユーザ:hogeをhugaの中にコピー。
        コンピュータ:サー!イエス!サー!hogeをhugaの直下に複製!(コピー中)ガンホー!ガンホー!ガンホー!
        ...なんてのは、ウザいな。

        親コメント
      • > ただ、UIがキーボード&ディスプレイの場合は両手と視覚がふさがってしまう
        > 欠点はあります。クルマの運転中のようにハンズフリーで視覚情報を妨げない
        > 使い方が求められるなら、会話型コンピュータもありかもしれません。
        > (って、カーナビがそうか)

        まさにK.I.T.T.ですな。
        会話型コンピュータの具現としては秀逸だと思われます。

        流れとしては、
         口頭でコマンド指示
         ↓
         処理後、Confirmダイアログ表示の代わりに"OK,Michael."
        となるわけで、OKを消すためのキーをステアリングに配置すればコンピュータ側
        でも認識できるのではないかと。
        --
        ---- 何ぃ!ザシャー
        親コメント
    • Re:SF的には (スコア:2, 興味深い)

      by goji (949) on 2011年03月01日 0時28分 (#1910068) ホームページ 日記

      SF的ということで、技術的な制約がないのだとしたら、自問自答やテレパシーみたいな感じで頭の中だけで会話が完結するほうが音声よりスマートだと思うけどな。
      音声でやり取りする必然性が良くわからない。

      親コメント
    • by usisi (41441) on 2011年02月28日 13時19分 (#1909717)

      > 音声入出力が自然ですね。

      自分の場合、手が先に出ちゃう・一緒に動いちゃうので
      ジェスチャー入力の方が自然かもしれません。

      入力している姿を第三者的に見ると
      キタキタおやじの可能性はありますが。

      --
      ID投稿推奨、マイナスモデ反対、リメンバー・スルー力。
      親コメント
    • by firewheel (31280) on 2011年03月01日 0時59分 (#1910071)

      そうでもないと思う。
      視線入力やらスティックやキーボードを組み合わせて使うのがむしろ自然。

      音声入力はとにかく遅くて不正確なので、使える場面がすごく限られるのです。
      #つか、これって今更説明するようなことか?

      親コメント
  • by kikki (30639) on 2011年02月28日 12時51分 (#1909690)
    声の質によっては大喜びする人たちもいるのでは?
  • by Anonymous Coward on 2011年02月28日 13時16分 (#1909715)

    まぁぶっちゃけ全部なんたら谷の現象なんじゃない?
    不気味の谷現象?

    それよりも早く、喋るパソコン彼女を!!

  • >音声で返ってくることは幾分か「恐怖」を感じる状況のようだ。同様に感じる人は多いのだろうか ?
    現状のPCで操作で「PCが喋る」時は、大抵エラーメッセージだから、特に怖く感じるんじゃないかなぁ?
    しかも、大抵は、ヘルプ見ても解決出来ない、理不尽な「出来ません」一辺倒だし。

    それと、長文を延々喋られても困る。
    括弧一個忘れたときのコンパイルエラーとか、/devをlsした結果とか、条件の甘い検索結果とか。
    あと、試した事無いけど、Webページを読み上げさせると永遠に広告を喋りそう...

    そいえば、無限ループでビープが鳴り続けるとユーザに恐怖感を与えるから、Windows7じゃBeep()にウェイト入れる対策がされたとか。

    現状UIでPCに喋らせても、要らない事ばかり言うだけで「会話」にならないと思うのだが。

    --
    -- Buy It When You Found It --
  • by snurf-kim (10835) on 2011年02月28日 13時22分 (#1909722) 日記

    米国の人々は、SF作品でありがちな「人工知能が人類に牙を剥く」タイプの話(「ウォーゲーム」や「ターミネーター」等)のせいでAI恐怖症に陥ってるのかもね。

    • by PEEK (27419) on 2011年02月28日 13時48分 (#1909737) 日記

      もっと根底には、自我意識をもったものを生み出すのは神の技を盗みし行為で
      それによって生まれるものは「神に祝福されえないもの」=「邪悪なもの」、
      って意識もあるんじゃないかな?

      #フランケンシュタイン・コンプレックスとか。

      --
      らじゃったのだ
      親コメント
  • コンピュータがしゃべったからどうこうというのは、特にはないです。
    操作する手段が増えてうれしいですね。
    #画面上に出てくるキャラクターが伺か風だとなおよし。
    --
    言葉は刃物。使いようでどうにでもなるものさ。
  • 多分大きな壁は、コンピューターが主体を持ってないあたり。すなわちオペレーターが独り言をいってるのか、他の第三者にいっているのか、自分(コンピューター)への指示なのか空気を読めない。Google音声検索は、目的を検索と決めうちしたうえで、音素分解して既存の単語との適合度でマッチングしてるだけですよね。主体を形成するには言葉を意味まで解析した上で、コンピューターが人との関係性を自覚し、呼ばれたのかもしくは会話に割り込むべきか判断しなきゃならない。社会性を持つ動物として進化してきた人間でもちゃんと実装されない症例がある。
  • by cm (41778) on 2011年02月28日 22時59分 (#1910036)

    背中で語ったり、拳で語ったりすることもある。
    コンピュータにそういう語り方をされると困る。

typodupeerror

目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond

読み込み中...