アカウント名:
パスワード:
>自分の場合は、コンピュータにどのプログラムを開きたいか口頭で伝えら得られたらどんなに良いだろうかと考えているのだが、
Dragon Naturally Speaking 2005 デモ [nuance.com]
音声認識ソフトをセットアップすればよい。Windows Vista [microsoft.com]やWindows 7 [microsoft.com]には音声認識機能が標準搭載されているみたいだけど。かつては IBM ViaVoice なんて製品もあったが、昨年サポートを終了 [nuance.com]しているのか。使っている人を見る機会もないので、音声でパソコン操作するニーズは一般にはないのかもね。
そういや OS/2Warp4 にも Voiceナビゲーション機能(日本語)が追加インストールできたけれど、モノ珍しさで使ったのは最初の数回だったな。eComStation2 に入れて久しぶりに遊んでみるか。
【関連ストーリー】Vistaの音声認識でPerlのコードを書く試み [srad.jp]
>人間が簡単にやっているような会話認識は無理。
A:「あれどう?」B:「きびしいね」
ってな会話は人間相手でも、相手(との関係や経験)によりけりで認識は無理ですね。
#こういう「曖昧な」会話は苦手な事が多い。
人間は自分の周囲の人間とだけ会話を成立させれば済みますが、Googleのサービスなんかは(言語すら異なる)世界中の人を相手にする必要があるわけで、どっちのほうが難しいかは一目瞭然ですね。
周囲の人間とだけ会話してればいい人も居るけど、電話やその他のコミニュケーションツールの発達のお陰でそうもいかない人も世の中には居るんですよ。もちろん(言語すら異なる)世界中の人を相手にしてしまう場合もあります。中には違う言語に聞こえるかの如くに同じ言語を操る人も居ます。
周囲の人間ですが、こっちからはまるであ・うんの呼吸が通じないのに、向こうからは通じると思い込んでいる人とコミュニケーションを取るというのもたまにあるし、それはそれできっついです。
>こっちからはまるであ・うんの呼吸が通じないのに、向こうからは通じると思い込んでいる人とコミュニケーションを取るというのもたまにあるし、それはそれできっついです。
そうか?何でもかんでも「例の件どうした?」などという奴は論外としても通じるはずの、阿吽の呼吸を感じ取っていない自分がいる・・・と、考えた事はないかね?
#とにかく気の利かない奴に悩まされているのでAC
>通じるはずの、阿吽の呼吸を感じ取っていない自分がいる・・・>と、考えた事はないかね?>>#とにかく気の利かない奴に悩まされているのでAC
どうもすみませんと頭を下げつつ、ソレは非常によくあります。相手は「そんなもん当然知ってるだろう」と思っているんでしょうけど。その件についてはまるで関わっていないし、連絡も受けていないというシチュエーションが多いのでさぞかし「全く気が利かない奴」とレッテル貼られていると思います>じぶん。
#もしかして、隣にいる人に書き込まれてたりして。
MLにこっちの名前は挙げないで関連情報を投稿して「貴方にはソレ(ML)でちゃんと連絡しました」とか後で言われるというのもよくある話。せめてMLに投稿するときに、関連者としてこちらの名前を追加するか、目の前に居るんだからワザワザML経由じゃ無くてできれば口頭で直接伝えて欲しいというのは贅沢な望みだそうです。なお、その人の信条は「仕事ではホウレンソウが大事」だとのこと。
#またここで愚痴ってしまった・・・
ここは分からないだろうな、と思って先回りして説明しても聞いてなくて、言ったばかりの事を聞いてくるのにはゲンナリ。質問される前に答えを言うのは無駄だね。
仰るとおりでございます m(_ _)m
>コンピュータにに
解析不能...
ディクテーションはViaVoiceの頃から遙かに良くなってもインタラクティブオペレーションにはまだまだ向かない。代名詞での対象の指定ができなかったり、会話中の文脈から対象を絞ったりができない時点でコンピュータのための命令列を人が構築しないとならないので無駄が多くなる、それだったら後ろのブースの人間とちょっとした会話しながらでも操作可能な今のインターフェースのほうがマシというか。
#実はディクテーションもとてつもなく賢く(あるいは柔らかく)ないと#「えーと」「あー、」「またか」「ちょ」「それじゃねぇ馬鹿!」が入力されて本人はいらだたしく、周りからはアホくさい状況に
Google音声検索 [impress.co.jp]エンジンの音声認識+検索クエリ予測精度がいい感じで、実用一歩手前位でかなり攻めてきてます。
これをPCでデスクトップ検索とセットで使いたいと思ってるんですけどね…PC向けには出てこなそう。
何度やっても「近所の美味しい店」わーいが「金魚の美味しい店」いらねーになる俺涙目
#滑舌が悪いとどもならん#近場の美味しい店は千葉菜の美味しい店だし(ねぇよ!)
今iPhone版で試したら、近所のおいしい店になりました。「すらしゅどっと」ってつぶやいたらslashdotで検索してくれました。ひゃっほい。
>Google音声検索 [impress.co.jp]エンジンの音声認識+検索クエリ予測精度がいい感じで、実用一歩手前位でかなり攻めてきてます。
私の声質かアクセントがおかしいのかもしれないけど、これ使ってみてほぼ正解が出たこと無いです。
#HT-03AでもXperia mini proでもダメ。OSが古い?
このGoogleの音声認識相当すごいよね。もう少しレスポンスとか良くなって欲しいけどもう実用レベルと言っても良いと思う。ただ携帯にブツブツ行っている感じで外見が悪い!
私としてはアプリの起動なんていらない。HALとかSALのレベルでいいから会話したいよ要は音声云々ではなくAI。もうちょい複雑なタスクを行って欲しいところ、比較資料作るとか比較品目と比各項目とか指示すれば勝手に資料にしてくれるとか
Googleの音声検索は確かにすごいです。周りが騒々しかったり、多少噛んだりしても候補に目的のものが上がることが多いです。一番使うのは「○○から○○」で経路検索だったりするんですけど、それ以外でも驚異の認識率だと思います。
読み上げた文章を推敲して、頭に思い描いた図を画像化してくれる時代が来てほしいです。ついでにExcelの計算式入力もしてほしい。
早く仕様書書きとかつまらない損益計算とかから開放されたい・・・。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー
音声認識ソフトを入れればいいじゃん (スコア:2, 参考になる)
>自分の場合は、コンピュータにどのプログラムを開きたいか口頭で伝えら得られたらどんなに良いだろうかと考えているのだが、
Dragon Naturally Speaking 2005 デモ [nuance.com]
音声認識ソフトをセットアップすればよい。Windows Vista [microsoft.com]やWindows 7 [microsoft.com]には音声認識機能が標準搭載されているみたいだけど。かつては IBM ViaVoice なんて製品もあったが、昨年サポートを終了 [nuance.com]しているのか。使っている人を見る機会もないので、音声でパソコン操作するニーズは一般にはないのかもね。
そういや OS/2Warp4 にも Voiceナビゲーション機能(日本語)が追加インストールできたけれど、モノ珍しさで使ったのは最初の数回だったな。eComStation2 に入れて久しぶりに遊んでみるか。
【関連ストーリー】Vistaの音声認識でPerlのコードを書く試み [srad.jp]
モデレータは基本役立たずなの気にしてないよ
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
>人間が簡単にやっているような会話認識は無理。
A:「あれどう?」
B:「きびしいね」
ってな会話は人間相手でも、相手(との関係や経験)によりけりで認識は無理ですね。
#こういう「曖昧な」会話は苦手な事が多い。
Re: (スコア:0)
人間は自分の周囲の人間とだけ会話を成立させれば済みますが、Googleのサービスなんかは(言語すら異なる)世界中の人を相手にする必要があるわけで、どっちのほうが難しいかは一目瞭然ですね。
Re:音声認識ソフトを入れればいいじゃん (スコア:2, 参考になる)
Google音声認識は文字通りの力業でどうにか出来ますが、自然言語による会話には
常識、周辺状況の認識、それらの系統的な処理…と言ってみれば人間の知的活動そのものを
再現しなければできないので。
もしよろしければ、「記号着地問題」や「フレーム問題」を調べてみて下さい。
何気なくしている会話が以下に高度な情報処理の下行われてるのか少し理解できると思います。
如何なる内容であろうとACでの書き込みは一切無視します。
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
周囲の人間とだけ会話してればいい人も居るけど、電話やその他のコミニュケーションツールの発達のお陰でそうもいかない人も世の中には居るんですよ。
もちろん(言語すら異なる)世界中の人を相手にしてしまう場合もあります。
中には違う言語に聞こえるかの如くに同じ言語を操る人も居ます。
周囲の人間ですが、こっちからはまるであ・うんの呼吸が通じないのに、向こうからは通じると思い込んでいる人とコミュニケーションを取るというのもたまにあるし、それはそれできっついです。
Re: (スコア:0)
>こっちからはまるであ・うんの呼吸が通じないのに、向こうからは通じると思い込んでいる人とコミュニケーションを取るというのもたまにあるし、それはそれできっついです。
そうか?
何でもかんでも「例の件どうした?」などという奴は論外としても
通じるはずの、阿吽の呼吸を感じ取っていない自分がいる・・・
と、考えた事はないかね?
#とにかく気の利かない奴に悩まされているのでAC
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
>通じるはずの、阿吽の呼吸を感じ取っていない自分がいる・・・
>と、考えた事はないかね?
>
>#とにかく気の利かない奴に悩まされているのでAC
どうもすみませんと頭を下げつつ、ソレは非常によくあります。
相手は「そんなもん当然知ってるだろう」と思っているんでしょうけど。
その件についてはまるで関わっていないし、連絡も受けていないというシチュエーションが多いので
さぞかし「全く気が利かない奴」とレッテル貼られていると思います>じぶん。
#もしかして、隣にいる人に書き込まれてたりして。
MLにこっちの名前は挙げないで関連情報を投稿して「貴方にはソレ(ML)でちゃんと連絡しました」とか後で言われるというのもよくある話。
せめてMLに投稿するときに、関連者としてこちらの名前を追加するか、目の前に居るんだからワザワザML経由じゃ無くてできれば口頭で直接伝えて欲しいというのは贅沢な望みだそうです。
なお、その人の信条は「仕事ではホウレンソウが大事」だとのこと。
#またここで愚痴ってしまった・・・
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
ここは分からないだろうな、と思って
先回りして説明しても聞いてなくて、言ったばかりの事を聞いてくるのにはゲンナリ。
質問される前に答えを言うのは無駄だね。
the.ACount
Re: (スコア:0)
1つ「後はたのんだ」
2つ「ボスの言うとおりです」
3つ「初めからこうなっていました」
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
仰るとおりでございます m(_ _)m
Re: (スコア:0)
Re: (スコア:0)
Re: (スコア:0)
コンピュータににどのプログラムを"開発"したいか口頭で伝えられたらいいだろう と空目して
そ~だったらいいのにな~♪と共感したのにそうではないのかbr>
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
>コンピュータにに
解析不能...
Re: (スコア:0)
ディクテーションはViaVoiceの頃から遙かに良くなってもインタラクティブオペレーションにはまだまだ向かない。
代名詞での対象の指定ができなかったり、会話中の文脈から対象を絞ったりができない時点でコンピュータのための命令列を人が構築しないとならないので無駄が多くなる、それだったら後ろのブースの人間とちょっとした会話しながらでも操作可能な今のインターフェースのほうがマシというか。
#実はディクテーションもとてつもなく賢く(あるいは柔らかく)ないと
#「えーと」「あー、」「またか」「ちょ」「それじゃねぇ馬鹿!」が入力されて本人はいらだたしく、周りからはアホくさい状況に
Re: (スコア:0)
Google音声検索 [impress.co.jp]エンジンの音声認識+検索クエリ予測精度がいい感じで、実用一歩手前位でかなり攻めてきてます。
これをPCでデスクトップ検索とセットで使いたいと思ってるんですけどね…PC向けには出てこなそう。
Re:音声認識ソフトを入れればいいじゃん (スコア:3, おもしろおかしい)
何度やっても
「近所の美味しい店」わーい
が
「金魚の美味しい店」いらねー
になる俺涙目
#滑舌が悪いとどもならん
#近場の美味しい店は千葉菜の美味しい店だし(ねぇよ!)
Re: (スコア:0)
今iPhone版で試したら、近所のおいしい店になりました。「すらしゅどっと」ってつぶやいたらslashdotで検索してくれました。
ひゃっほい。
Re:音声認識ソフトを入れればいいじゃん (スコア:1)
>Google音声検索 [impress.co.jp]エンジンの音声認識+検索クエリ予測精度がいい感じで、実用一歩手前位でかなり攻めてきてます。
私の声質かアクセントがおかしいのかもしれないけど、これ使ってみてほぼ正解が出たこと無いです。
#HT-03AでもXperia mini proでもダメ。OSが古い?
Re: (スコア:0)
このGoogleの音声認識相当すごいよね。もう少しレスポンスとか良くなって欲しいけど
もう実用レベルと言っても良いと思う。ただ携帯にブツブツ行っている感じで外見が悪い!
私としてはアプリの起動なんていらない。HALとかSALのレベルでいいから会話したいよ
要は音声云々ではなくAI。もうちょい複雑なタスクを行って欲しいところ、比較資料作るとか
比較品目と比各項目とか指示すれば勝手に資料にしてくれるとか
Re: (スコア:0)
Googleの音声検索は確かにすごいです。周りが騒々しかったり、多少噛んだりしても候補に目的のものが上がることが多いです。一番使うのは「○○から○○」で経路検索だったりするんですけど、それ以外でも驚異の認識率だと思います。
読み上げた文章を推敲して、頭に思い描いた図を画像化してくれる時代が来てほしいです。
ついでにExcelの計算式入力もしてほしい。
早く仕様書書きとかつまらない損益計算とかから開放されたい・・・。