アカウント名:
パスワード:
こういう信者専用ホルホル記事はやめていただきたい。
スイッチを押せば済む処理を、わざわざ声を出して音声認識させなきゃいけないなんて面倒くさくてたまりませんよなおかつ処理結果を確認するのに時間をかけて合成音声を聞かなきゃいけないなんてアホくさくてやってられませんよ
昔から音声認識に向いたアプリケーションとそうでないアプリケーションははっきりしていて、無理に使う必要など無いってのは分かり切ってることです音声認識が「役に立った」のが有名なのは下記のようなもんです・精肉工場での肉の品質検査結果の記録(手が油でベタベタ)・鉄板の圧延工場で機械を操作しながら傷の目視検査をして傷の発見位置を記録(両手が塞がってる)いずれも音声認識した結果のその場のレスポンスは無しで、一方的に認識結果を記録しているだけであることに注目してください
iPhoneのシステムは適切な状況判断でタスクを処理してるのは技術的になかなかのものだと思うが、それでも実際に音声認識ばっかりで操作してみたら相当にイラッとするはずですよ
音声認識が「役に立った」のが有名なのは下記のようなもんです・精肉工場での肉の品質検査結果の記録(手が油でベタベタ)
ネスレレシピ for iPadは、右、左、上、下とiPadに話しかけるとレシピをスクロールしてくれます。タイマーセットも音声で出来れば、なおいいんですけどね。
スクロールするより、ニンテンドーDSででてるレシピのほうが筋がいいと思うけどなあ…
そうは言っても気づくと古いコンピュータを使おうとする時、マウスに向かって喋ってしまう [youtube.com]ようになってるかもしれませんよ。
かつてCUI信者はGUIに対してそう言ったんでしょうね。「コマンドをタイプすれば済む処理を、わざわざメニューから何回もクリックしなきゃいけないなんて面倒くさくてたまりませんよ」
今でもGUIって面倒くさいですけど. 同じような操作を繰り替えして行うような場合だと, GUIなんて使っていられないです.
次は一連の動作を記録し、その動作を「新語」として登録する機能の出番ですね。是非「たわばっ」「ひでぶっ」「あべしっ」など登録して街中で叫んで頂きたい。
音声で指示を出すのってまさにCUIだと思いますけど。命令(コマンド)を知らないとどうにもならない。Siriがなにをしてくれるのか、なにができるのか知らないと「できません」ということになる。言うなればコマンド入力式アドベンチャーを音声でやるようなものかな?
結局ウィットに富んだエラーメッセージが返ってくるだけの違いじゃないの?「コマンドまたはファイル名が違います」よりはマシな程度の。
おっと,
>> 命令(コマンド)を知らないと
から
>> Siriがなにをしてくれるのか、なにができるのか知らないと
へと話がすり替わってますね.
CUIにおいて「なにをしてくれるのか,なにができるのか」は知っていて,でも「コマンドを知らない」っていうのは非常に多い状況ですよ.だからこそ,正確なコマンドを知らないと使えないCUIよりは対話的にメニューから選択するタイプのGUIの方が初心者受けが良いわけです.(よく言われるように,実際には熟練者にとってはCUIの方が圧倒的に作業効率が良いというケースも多いですが)
コマンドってまさに“なにをするか”だと思うんですけどねぇ。すり替わってますかね?自覚はないんですが。
GUIのようにメニュー項目(どのアイコンを選べばどういう作業をしてくれるか)を覚えたりしなくても,
GUIの基本は覚えることじゃないんです。まず対象を選び、動作を選ぶ。その対象物にできない動作は選べない。CUIではコマンド名だけじゃなくその後に続く引数の意味や順番まで覚えていないといけない。アイコンがどうとかそういうことじゃないんですよ。それでこの音声認識がどうかというと、やっぱり覚えないとどうにもならないと思うんですね。他人が「こんなことに
GUI/CUI論争に持っていける性質の話じゃないと思いますが。まず音声入力自体の方がよっぽど遅いという人間側のボトルネックをなんとかしないと、ユーザー補助の域を脱しないレベルでしかない。だからこそナビゲーションや精肉検査等の特定分野への適用にしか伸びていかない訳で。音声入力システムに出来る情報処理量の少なさに関しては今回のSiriをもってしても根本的な改善には至っていないように見えます。
ただしSiriの人工知能的素晴らしさとか音声コントロールとしての使い勝手拡張についての話は別に出来ると思います。
> まず音声入力自体の方がよっぽど遅いという人間側のボトルネック
人間の会話速度で入力できるのは速記タイプという特殊能力をもつ人くらいですよ。いま、音声入力が遅いとしたら、コンピューター側の問題です。
でも見てる限り真の意味で会話を理解して対応する人工知能ってレベルではないですし。ぶっちゃけCUI→GUIと来てたUIの流れを、GUI→音声を使ったCUI戻してみました、みたいな…。
過去に捕らわれて判断を誤るほうがどうかしていますよ。確かにちょっと前には一般人向けで使い物にならなかったが、過去ばかり見て面倒くさいとかの結論を出すのは稚拙ではないか?過去の機械はボタンを押すような単純なI/Fしか対応できなかっただけです。
「昔から音声認識に...」にある例だって、それが作られる以前のシステムはとてもそのようなものに使えなかったものだった。音声によるシステムはその時代以外でも使えないから使えるへ着実に進化しています。少なくともモバイル検索ではAndroid上では便利なものになっている。
あと、音声認識「ばっかり」とかいう変な条件ならそりゃイラッとくるでしょうね。
AndrooidのVoice Search、最初は「んなもん役に立つか!」と思って起動もしなかったんですが、ふと思い立って試したら信じられないほど認識率が高い。自分の場合、誤認識を数えてみたら5%以下だったのでそれ以来愛用してます。
この世の全ての人があなたと同じレベルのスキルがあるわけではないと思いますけど。何しろパソコン教室などで「立ち上げてください」と言われて自分が立ち上がる人がいるというパソコンが出来る人から見れば笑い話のようなことが実際にあるそうですからね。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
普通のやつらの下を行け -- バッドノウハウ専門家
このような音声認識は以前からある。 (スコア:0)
こういう信者専用ホルホル記事はやめていただきたい。
Re:このような音声認識は以前からある。 (スコア:1)
スイッチを押せば済む処理を、わざわざ声を出して音声認識させなきゃいけないなんて面倒くさくてたまりませんよ
なおかつ処理結果を確認するのに時間をかけて合成音声を聞かなきゃいけないなんてアホくさくてやってられませんよ
昔から音声認識に向いたアプリケーションとそうでないアプリケーションははっきりしていて、無理に使う必要など無いってのは分かり切ってることです
音声認識が「役に立った」のが有名なのは下記のようなもんです
・精肉工場での肉の品質検査結果の記録(手が油でベタベタ)
・鉄板の圧延工場で機械を操作しながら傷の目視検査をして傷の発見位置を記録(両手が塞がってる)
いずれも音声認識した結果のその場のレスポンスは無しで、一方的に認識結果を記録しているだけであることに注目してください
iPhoneのシステムは適切な状況判断でタスクを処理してるのは技術的になかなかのものだと思うが、それでも実際に音声認識ばっかりで操作してみたら相当にイラッとするはずですよ
Re:このような音声認識は以前からある。 (スコア:3)
音声認識が「役に立った」のが有名なのは下記のようなもんです
・精肉工場での肉の品質検査結果の記録(手が油でベタベタ)
ネスレレシピ for iPadは、右、左、上、下とiPadに話しかけるとレシピをスクロールしてくれます。
タイマーセットも音声で出来れば、なおいいんですけどね。
Re: (スコア:0)
スクロールするより、ニンテンドーDSででてるレシピのほうが筋がいいと思うけどなあ…
Re:このような音声認識は以前からある。 (スコア:2)
そうは言っても気づくと古いコンピュータを使おうとする時、マウスに向かって喋ってしまう [youtube.com]ようになってるかもしれませんよ。
Re:このような音声認識は以前からある。 (スコア:1)
かつてCUI信者はGUIに対してそう言ったんでしょうね。
「コマンドをタイプすれば済む処理を、わざわざメニューから何回もクリックしなきゃいけないなんて面倒くさくてたまりませんよ」
Re:このような音声認識は以前からある。 (スコア:2)
今でもGUIって面倒くさいですけど. 同じような操作を繰り替えして行うような場合だと, GUIなんて使っていられないです.
Re: (スコア:0)
次は一連の動作を記録し、その動作を「新語」として登録する機能の出番ですね。
是非「たわばっ」「ひでぶっ」「あべしっ」など登録して街中で叫んで頂きたい。
Re: (スコア:0)
音声で指示を出すのってまさにCUIだと思いますけど。
命令(コマンド)を知らないとどうにもならない。
Siriがなにをしてくれるのか、なにができるのか知らないと「できません」ということになる。
言うなればコマンド入力式アドベンチャーを音声でやるようなものかな?
結局ウィットに富んだエラーメッセージが返ってくるだけの違いじゃないの?
「コマンドまたはファイル名が違います」よりはマシな程度の。
Re: (スコア:0)
おっと,
>> 命令(コマンド)を知らないと
から
>> Siriがなにをしてくれるのか、なにができるのか知らないと
へと話がすり替わってますね.
CUIにおいて「なにをしてくれるのか,なにができるのか」は知っていて,でも「コマンドを知らない」っていうのは非常に多い状況ですよ.だからこそ,正確なコマンドを知らないと使えないCUIよりは対話的にメニューから選択するタイプのGUIの方が初心者受けが良いわけです.(よく言われるように,実際には熟練者にとってはCUIの方が圧倒的に作業効率が良いというケースも多いですが)
Re: (スコア:0)
コマンドってまさに“なにをするか”だと思うんですけどねぇ。
すり替わってますかね?
自覚はないんですが。
GUIの基本は覚えることじゃないんです。
まず対象を選び、動作を選ぶ。
その対象物にできない動作は選べない。
CUIではコマンド名だけじゃなくその後に続く引数の意味や順番まで覚えていないといけない。
アイコンがどうとかそういうことじゃないんですよ。
それでこの音声認識がどうかというと、やっぱり覚えないとどうにもならないと思うんですね。
他人が「こんなことに
Re: (スコア:0)
GUI/CUI論争に持っていける性質の話じゃないと思いますが。
まず音声入力自体の方がよっぽど遅いという人間側のボトルネックをなんとかしないと、ユーザー補助の域を脱しないレベルでしかない。だからこそナビゲーションや精肉検査等の特定分野への適用にしか伸びていかない訳で。
音声入力システムに出来る情報処理量の少なさに関しては今回のSiriをもってしても根本的な改善には至っていないように見えます。
ただしSiriの人工知能的素晴らしさとか音声コントロールとしての使い勝手拡張についての話は別に出来ると思います。
Re: (スコア:0)
> まず音声入力自体の方がよっぽど遅いという人間側のボトルネック
人間の会話速度で入力できるのは速記タイプという特殊能力をもつ人くらいですよ。
いま、音声入力が遅いとしたら、コンピューター側の問題です。
Re: (スコア:0)
でも見てる限り真の意味で会話を理解して対応する人工知能ってレベルではないですし。
ぶっちゃけCUI→GUIと来てたUIの流れを、GUI→音声を使ったCUI戻してみました、みたいな…。
Re: (スコア:0)
今の(4S以外の)iPhoneでもある程度の音声コントロールはできるけど、
歩きながら電話をかける時とか、私はかなり役に立ってますよ。
これは「認識結果の記録だけ」じゃなく、その場でのレスポンスとコントロールです。
>スイッチを押せば済む処理を、わざわざ声を出して音声認識させなきゃいけないなんて面倒くさくてたまりませんよ
今のスマホだと、その「スイッチを押す」ためには画面を見なきゃだめなんです。
例えば歩いている時など、他のものを見ていなければならない時に、その行為を中断しなくて済むという事は便利ですよ。実際の経験上。
Re: (スコア:0)
過去に捕らわれて判断を誤るほうがどうかしていますよ。
確かにちょっと前には一般人向けで使い物にならなかったが、過去ばかり見て面倒くさいとかの結論を出すのは稚拙ではないか?
過去の機械はボタンを押すような単純なI/Fしか対応できなかっただけです。
「昔から音声認識に...」にある例だって、それが作られる以前のシステムはとてもそのようなものに使えなかったものだった。音声によるシステムはその時代以外でも使えないから使えるへ着実に進化しています。
少なくともモバイル検索ではAndroid上では便利なものになっている。
あと、音声認識「ばっかり」とかいう変な条件ならそりゃイラッとくるでしょうね。
Re:このような音声認識は以前からある。 (スコア:1)
AndrooidのVoice Search、最初は「んなもん役に立つか!」と思って起動もしなかったんですが、ふと思い立って試したら
信じられないほど認識率が高い。自分の場合、誤認識を数えてみたら5%以下だったのでそれ以来愛用してます。
Re: (スコア:0)
この世の全ての人があなたと同じレベルのスキルがあるわけではないと思いますけど。
何しろパソコン教室などで「立ち上げてください」と言われて自分が立ち上がる人がいるというパソコンが出来る人から見れば笑い話のようなことが実際にあるそうですからね。