
会話ができるコンピュータがあったら嬉しい ? それとも怖い ? 95
ストーリー by reo
ボウマン、やめて…ボウマン 部門より
ボウマン、やめて…ボウマン 部門より
capra 曰く、
本家 /. 記事「Talking To Computers?」より。
コンピュータに話しかけるのは不自然だろうか ? 米人気クイズ番組の Jeopardy に出演したコンピュータについて幾人かの同僚と話したところ、コンピュータに話しかけて、それに応じた答えが音声で返ってくることは幾分か「恐怖」を感じる状況のようだ。同様に感じる人は多いのだろうか ?
自分の場合は、コンピュータにどのプログラムを開きたいか口頭で伝えら得られたらどんなに良いだろうかと考えているのだが、同意を多く得られる訳ではないようで驚いている。
コンピュータを罵倒するわけではなく、普通に話しかけ返事もらいたいというのはそんなに受け入れられないものなのだろうか ? Jeopardy で活躍した Watson のようなコンピュータを作りたいと思う人は自分以外にもいるのか、それとも恐怖を感じる人の方が多いのだろうか。
Jeopardy で圧勝したという Watson (/.J 記事) については IBM の公式サイトに詳しい。
音声認識ソフトを入れればいいじゃん (スコア:2, 参考になる)
>自分の場合は、コンピュータにどのプログラムを開きたいか口頭で伝えら得られたらどんなに良いだろうかと考えているのだが、
Dragon Naturally Speaking 2005 デモ [nuance.com]
音声認識ソフトをセットアップすればよい。Windows Vista [microsoft.com]やWindows 7 [microsoft.com]には音声認識機能が標準搭載されているみたいだけど。かつては IBM ViaVoice なんて製品もあったが、昨年サポートを終了 [nuance.com]しているのか。使っている人を見る機会もないので、音声でパソコン操作するニーズは一般にはないのかもね。
そういや OS/2Warp4 にも Voiceナビゲーション機能(日本語)が追加インストールできたけれど、モノ珍しさで使ったのは最初の数回だったな。eComStation2 に入れて久しぶりに遊んでみるか。
【関連ストーリー】Vistaの音声認識でPerlのコードを書く試み [srad.jp]
モデレータは基本役立たずなの気にしてないよ
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
>人間が簡単にやっているような会話認識は無理。
A:「あれどう?」
B:「きびしいね」
ってな会話は人間相手でも、相手(との関係や経験)によりけりで認識は無理ですね。
#こういう「曖昧な」会話は苦手な事が多い。
Re:音声認識ソフトを入れればいいじゃん (スコア:2, 参考になる)
Google音声認識は文字通りの力業でどうにか出来ますが、自然言語による会話には
常識、周辺状況の認識、それらの系統的な処理…と言ってみれば人間の知的活動そのものを
再現しなければできないので。
もしよろしければ、「記号着地問題」や「フレーム問題」を調べてみて下さい。
何気なくしている会話が以下に高度な情報処理の下行われてるのか少し理解できると思います。
如何なる内容であろうとACでの書き込みは一切無視します。
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
周囲の人間とだけ会話してればいい人も居るけど、電話やその他のコミニュケーションツールの発達のお陰でそうもいかない人も世の中には居るんですよ。
もちろん(言語すら異なる)世界中の人を相手にしてしまう場合もあります。
中には違う言語に聞こえるかの如くに同じ言語を操る人も居ます。
周囲の人間ですが、こっちからはまるであ・うんの呼吸が通じないのに、向こうからは通じると思い込んでいる人とコミュニケーションを取るというのもたまにあるし、それはそれできっついです。
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
>通じるはずの、阿吽の呼吸を感じ取っていない自分がいる・・・
>と、考えた事はないかね?
>
>#とにかく気の利かない奴に悩まされているのでAC
どうもすみませんと頭を下げつつ、ソレは非常によくあります。
相手は「そんなもん当然知ってるだろう」と思っているんでしょうけど。
その件についてはまるで関わっていないし、連絡も受けていないというシチュエーションが多いので
さぞかし「全く気が利かない奴」とレッテル貼られていると思います>じぶん。
#もしかして、隣にいる人に書き込まれてたりして。
MLにこっちの名前は挙げないで関連情報を投稿して「貴方にはソレ(ML)でちゃんと連絡しました」とか後で言われるというのもよくある話。
せめてMLに投稿するときに、関連者としてこちらの名前を追加するか、目の前に居るんだからワザワザML経由じゃ無くてできれば口頭で直接伝えて欲しいというのは贅沢な望みだそうです。
なお、その人の信条は「仕事ではホウレンソウが大事」だとのこと。
#またここで愚痴ってしまった・・・
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
仰るとおりでございます m(_ _)m
Re:音声認識ソフトを入れればいいじゃん (スコア:3, おもしろおかしい)
何度やっても
「近所の美味しい店」わーい
が
「金魚の美味しい店」いらねー
になる俺涙目
#滑舌が悪いとどもならん
#近場の美味しい店は千葉菜の美味しい店だし(ねぇよ!)
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
>Google音声検索 [impress.co.jp]エンジンの音声認識+検索クエリ予測精度がいい感じで、実用一歩手前位でかなり攻めてきてます。
私の声質かアクセントがおかしいのかもしれないけど、これ使ってみてほぼ正解が出たこと無いです。
#HT-03AでもXperia mini proでもダメ。OSが古い?
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
>コンピュータにに
解析不能...
セキュリティ面 (スコア:2)
確か以前SunOSに音声デバイスが誰でもアクセスできるパミッション問題があって、リモートユーザーがそれを利用してマイクをアクセスしてワークステーションのある場所を盗聴できたり、不気味な音声を再生してワークステーション前の人脅かしたりことはできていた、という話は聞いたことあります。故に現在のLinuxディストリビューションはいろいろ工夫して音声デバイスのアクセス権をコンソールユーザーにしか与えないようにしているし、個人的に常時マイクを入れることに抵抗感があります。
ネット接続パソコンに常時オンしてるマイクを使うのは、もしマルウェアが入ったら盗聴器が仕掛けられた同様というリスクが負うことも考えなくてはならないかもしれないね。
Re:セキュリティ面 (スコア:1)
>cat hadouhou.aiff > /dev/audio
有能な秘書や執事みたいに喋れるならともかく... (スコア:2)
多分イライラしてくるでしょう。
こっちが期待する答をちゃんと返してくれるはずがない訳で。
例えばどこかへ行く経路を調べさせた時、今のwebサービスのようにずらずらと情報を喋ってくれたら何のことやら訳がわからないだけでしょう。人間は画面に表示されている情報から、自分が必要な情報のみピックアップしています。それをコンピュータにやらせるのはかなり難しいのではないかと。
--- de FTNS.
>会話ができるコンピュータがあったら嬉しい ? それとも怖い ? (スコア:1)
(客観的に見ると)コンピュータに話しかけてる自分が怖い…
Re:>会話ができるコンピュータがあったら嬉しい ? それとも怖い ? (スコア:3, すばらしい洞察)
SF的には (スコア:1)
個人的には、画面等に向かって喋るのではなく、人型の何かに向かって喋る方が良いかな。
マニュピレーターで作業の手伝いもしてくれると便利だと思う
------------
惑星ケイロンまであと何マイル?
Re:SF的には (スコア:2)
23世紀SF的に、マウスに向かって「コンピューター?」とか話しかけることもあるかもしれませんが、気持ち悪いとか以前に不便じゃないですか?普段からキーボードを多用しているような人なら、話すよりキータイプしたほうが早い、という人は珍しくない(というよりおそらく多数派)ですよね。また、人の話を聴くより文字を読むほうが早い。会話型インターフェイスだと時間がかかって仕方がない。
ただ、UIがキーボード&ディスプレイの場合は両手と視覚がふさがってしまう欠点はあります。クルマの運転中のようにハンズフリーで視覚情報を妨げない使い方が求められるなら、会話型コンピュータもありかもしれません。(って、カーナビがそうか)
Re:SF的には (スコア:1)
おっしゃるように、読むことや書くことに集中してると、聞く話すより密度が高いような気がします。
それは練習の成果らしいですので、UIが選べるとどうなるか判りません。
------------
惑星ケイロンまであと何マイル?
UIが賢ければね (スコア:2, 興味深い)
確かに、話し言葉の方がUI的に優れてる感は在るかも。
例えば、PC操作の上手い人に「これやっといてね」で、作業が済む訳で。
でも、操作の拙い人相手に、言葉だけで操作を説明する苦労を考えると、現状じゃ到底便利とは思えないんだが。
あと、現状GUIだと、「見つけた物」をクリックすれば動作する仕様なんで、「見て探す」機能の代替品が無いと、UIとして成立しないかと。
字幕映画が成立する様に、黙読速度は聞くよりも圧倒的に速くて(外国語を除く)、それに「流し読み」が加わると、聴覚的な情報じゃ全然追いつかないのが実情。
視線トレースマウスと併用で、「それ開いて」で済めば、多分使える様な気はするけど、長ったらしいファイル名やURLを言わされるUIじゃ、全然便利に思えない。
それから、別スレのコメントに在ったが、「あれこれそれ」で、適確に指示出来ないと困るんだけど、現状だと文脈で理解はしてくれないんだよね。
で、それが実現出来るUIだと、多分、キーが2,3個有るだけで大抵の操作が出来る様なUIになってる気がする。
今でも、そこそこ賢いUIで、調子が良い時は、OK押すだけで、結構使える事が多いし。
現状で一番の問題は、UIが予想を外した時に、正しく指示するのが果てしなく面倒な点かと。
要は、そもそも、現状UIの頭の悪さをなんとかしないとって事で。
-- Buy It When You Found It --
Re:SF的には (スコア:1)
マウスに話しかける感じじゃなくて、
ロボットじゃないよアンドロイドだよな感じの秘書が助けてくれる感じかな~
------------
惑星ケイロンまであと何マイル?
Re:SF的には (スコア:1)
>23世紀SF的に、マウスに向かって「コンピューター?」とか話しかけることもあるかもしれませんが、気持ち悪いとか以前に不便じゃないですか?
たぶんその頃でもSF的にでも「マウス」に向かって話しかけるUIはあんまり無いと思う。
もし貴方がバロットかボイルドなら、「ウフコック」には話しかけるかもしれないけど。
マウスに向かって「左上3cmクリック、右下5cmまでドラッグ、リリース、遅い、行き過ぎた!」とか命令するのは面白いかも。
#すんげー不便そう。
Re:SF的には (スコア:1)
ほぼ同様の操作を, 映画「ブレードランナー」の中でやっているシーンがありますけど, 酒かっくらいながらのような余裕のある時でもなければ使えないという気がします. 特定用途向けで単語の羅列のみで操作できる現実的なインターフェイスだけど, 30年後の今の視点だと, ホイール付マウスを使ったほうが明らかに楽そう.
Re:SF的には (スコア:1)
往年のAh!SKIで「自動JOY STICK」だか言うのを作ってたのを思い出した。
他人のマウスをこっそり自走マウスと入れ替えて反応を見るというドッキリがあったら微妙に面白そう。
Re:SF的には (スコア:1)
たしかに、マリーン風に...
ユーザ:hogeをhugaの中にコピー。
コンピュータ:サー!イエス!サー!hogeをhugaの直下に複製!(コピー中)ガンホー!ガンホー!ガンホー!
...なんてのは、ウザいな。
Re:SF的には (スコア:1)
> 欠点はあります。クルマの運転中のようにハンズフリーで視覚情報を妨げない
> 使い方が求められるなら、会話型コンピュータもありかもしれません。
> (って、カーナビがそうか)
まさにK.I.T.T.ですな。
会話型コンピュータの具現としては秀逸だと思われます。
流れとしては、
口頭でコマンド指示
↓
処理後、Confirmダイアログ表示の代わりに"OK,Michael."
となるわけで、OKを消すためのキーをステアリングに配置すればコンピュータ側
でも認識できるのではないかと。
---- 何ぃ!ザシャー
Re:SF的には (スコア:2, 興味深い)
SF的ということで、技術的な制約がないのだとしたら、自問自答やテレパシーみたいな感じで頭の中だけで会話が完結するほうが音声よりスマートだと思うけどな。
音声でやり取りする必然性が良くわからない。
Re:SF的には (スコア:1)
> 音声入出力が自然ですね。
自分の場合、手が先に出ちゃう・一緒に動いちゃうので
ジェスチャー入力の方が自然かもしれません。
入力している姿を第三者的に見ると
キタキタおやじの可能性はありますが。
ID投稿推奨、マイナスモデ反対、リメンバー・スルー力。
Re:SF的には (スコア:1)
そうでもないと思う。
視線入力やらスティックやキーボードを組み合わせて使うのがむしろ自然。
音声入力はとにかく遅くて不正確なので、使える場面がすごく限られるのです。
#つか、これって今更説明するようなことか?
Re:SF的には(おふとぴ (スコア:1)
「負けるな○人」とか言うと勝ったりするし^^;
------------
惑星ケイロンまであと何マイル?
Re:SF的には (スコア:1)
GR1って、最後は命令無視しちゃったんだよな。
声優さんよろしく (スコア:1)
怖い?嬉しい? (スコア:1, 興味深い)
まぁぶっちゃけ全部なんたら谷の現象なんじゃない?
不気味の谷現象?
それよりも早く、喋るパソコン彼女を!!
Re:怖い?嬉しい? (スコア:1)
>それよりも早く、喋るパソコン彼女を!!
信じられないかもしれませんが、世間では「喋らない嫁」のニーズもあるらしいです。
Re:怖い?嬉しい? (スコア:1)
そういや(最初の)楓ちゃんや瑠璃子さんは喋らなかったな(確かに無口ではありましたが)
さくらも一部しか喋らなかったし。
らじゃったのだ
長文と「それは出来ない」攻撃が怖い (スコア:1)
>音声で返ってくることは幾分か「恐怖」を感じる状況のようだ。同様に感じる人は多いのだろうか ?
現状のPCで操作で「PCが喋る」時は、大抵エラーメッセージだから、特に怖く感じるんじゃないかなぁ?
しかも、大抵は、ヘルプ見ても解決出来ない、理不尽な「出来ません」一辺倒だし。
それと、長文を延々喋られても困る。
括弧一個忘れたときのコンパイルエラーとか、/devをlsした結果とか、条件の甘い検索結果とか。
あと、試した事無いけど、Webページを読み上げさせると永遠に広告を喋りそう...
そいえば、無限ループでビープが鳴り続けるとユーザに恐怖感を与えるから、Windows7じゃBeep()にウェイト入れる対策がされたとか。
現状UIでPCに喋らせても、要らない事ばかり言うだけで「会話」にならないと思うのだが。
-- Buy It When You Found It --
AI恐怖症 (スコア:1)
米国の人々は、SF作品でありがちな「人工知能が人類に牙を剥く」タイプの話(「ウォーゲーム」や「ターミネーター」等)のせいでAI恐怖症に陥ってるのかもね。
Re:AI恐怖症 (スコア:1)
もっと根底には、自我意識をもったものを生み出すのは神の技を盗みし行為で
それによって生まれるものは「神に祝福されえないもの」=「邪悪なもの」、
って意識もあるんじゃないかな?
#フランケンシュタイン・コンプレックスとか。
らじゃったのだ
自動販売機にお疲れ様ですと言われるのだから (スコア:1)
操作する手段が増えてうれしいですね。
#画面上に出てくるキャラクターが伺か風だとなおよし。
言葉は刃物。使いようでどうにでもなるものさ。
HAL LOW GOOD BYE (スコア:1)
漢は (スコア:1)
背中で語ったり、拳で語ったりすることもある。
コンピュータにそういう語り方をされると困る。
Re:コンピュータと人間の意思疎通を仲介する存在 (スコア:1, おもしろおかしい)
Re:コンピュータと人間の意思疎通を仲介する存在 (スコア:1)
ロシア語で考えるんだ
Re:コンピュータと人間の意思疎通を仲介する存在 (スコア:1)
トリニティ [biglobe.ne.jp]ですね. 分かります.
情報サイボーグ [biglobe.ne.jp]というアプローチもあるのですが, こちらは金(最新戦闘艦なみ)と訓練期間がかかりますし.
Re:コンピュータと人間の意思疎通を仲介する存在 (スコア:1)
>マシン語と人間の言語を相互変換する能力に長けたヒトモドキな何者か
ダムゲート・コントロール施したり、「お披露目」したり大変かもしれない。
#その何者かにマスターとして認められないとPC使えないとか
らじゃったのだ
Re:認識ってレベルで無く会話ってレベルで出来るのなら (スコア:3, おもしろおかしい)
>たぶん、「ウザい」。
もしかして、コマンドオプションに "-v"を付けてませんか?
Re:認識ってレベルで無く会話ってレベルで出来るのなら (スコア:1)
Re:会話ができるコンピュータ (スコア:1)
国内ではボーカロイドやゆっくり(ソフトーク)が一定の市民権を得ているので、
電子音声自体に違和感や恐怖を感じるひとは少ない
かな?
Re:会話ができるコンピュータ (スコア:1)
とっくにエミーⅡで慣れてたので全然おっけーです
#結局裏ワザ使って見たgesaku
Re:コンピュータではないけど (スコア:2)
開発試作機を環境試験機に長期間放り込む時は
必ず声をかけます。
「がんばれよ」
「お前なら耐えられる」
「自分を信じるんだ!」
「これしきの温度サイクル、屁でもないよな!」
「よし、この調子であと一晩頼むよ」
ちなみに見ていた後輩に何やってるんですか? と不気味がられたのでオススメはしません。
ただ、声をかけない時よりコケる率が減った気もする。
Re:コンピュータではないけど (スコア:2)