パスワードを忘れた? アカウント作成
15506494 journal
日記

oruseの日記: alexa雑感 3

日記 by oruse

先日のAmazonのブラックフライデーで、EchoDot(第3世代)と、Switchbotハブミニのセットを購入した。タイミングのせいかセット価格で2,990円となっており、確かSwichbotハブミニ単体でも同じような価格だったので、EchoDotはタダ同然となる。在庫処分だろうか。

実は、その前のアマゾンプライムで、EchoShow5(第1世代)と、Switchハブミニを購入しており、キッチンで使用していて概ね良好な印象があるが、使い方が特殊なのか一点困ったことがあった。

キッチンの出窓に置いて、洗い物の際などに、BGM的に音楽を流している。
Echo単体だと、さすがに音質に難があるので、安価な一体型のコンポ(Victor NX-W30 15k円程度)を買って、近くに置いてBT接続している。

「アレクサ、ヒーリングミュージックをかけて」

で、毎回それなりに違う曲をかけてくれるので、いい感じではある。コンポの電源をONするだけで、自動でBT接続してくれるし、プライムの中でAmazon Musicはあまり使っていなかったので、お得感もある。

ただ近くで別の音源があると、アレクサの音声認識率がかなり落ちるのだ。

「アレクサ」で無視。
大きく「アレクサ!」 …で、やっと反応し(画面上のインジケータが光る)、音楽が消音される。
「止めて」…まだ無視。
大きく、「アレクサ、止めて」…やっぱり無視。
大きく、「アレクサ!、止めて!」で、やっと音楽が止まる。

人間ならその時言われるフレーズを予測して聞くので、周りに違う音源があっても聞き逃さないのだろうが、その辺はまだ無理みたいで、画面上に「止めてと言って」と表示しといてそれを言っても平気で無視するので、人間の感性からすると結構なストレスとなる。

めんどくさい洗い物の最中に、ヒーリング音楽を流し、洗い終わって、最後にこれだと、「アレクサの役立たず、かえって苛立つでしょ」とか言いたくなる。

このEchoShow5を、EchoDot(第3世代)に変えてみた。評判どおり、マイク性能はEchoDot(第3世代)の方が格段によい。上記のようなシチュエーションでも、ほぼ認識してくれる。予想が当たるとなんか嬉しく、すぐに調子に乗るのも人間だ。

この程度の性能なら実用範囲かと思い、この部屋にもSwitchbotハブミニを設置してみた。

「アレクサ、スピーカーをつけて」

コンポの電源が入り、10秒程度はかかるが、「ピポッ」とか言って、BT接続する。

「アレクサ、クラシックをかけて」

で、音楽が流れる。これクラシックなの?みたいなイージーリスニング的な選曲が多い気がするが、悪くはない。

「アレクサ、止めて」
「アレクサ、スピーカーを消して」

以上、問題なく動作する。

で、調子に乗る。

照明も音声認識で操作したい。
Switchbotはそもそも日本の家電のリモコンのプリセットが少なく、まず自動認識では使えないので、もう初めから新規登録から赤外線を読み込み、一個一個リモコンのボタンを登録している。シーンを作成し、アクセサアプリと連携して使用する。

実は別の部屋でもう一つのSwitchbotハブミニが設置してある。

「アレクサ、照明をつけて」

は、それそれの部屋で、その部屋の照明をつけて欲しい。

「アレクサ、リビングの照明をつけて」

なら、問題なく動作する。
ただ同一のフレーズで、それぞれの部屋の照明を操作する方法がわからない。グループを設定することにより可能との情報もあるが、やってみるとうまくいかない。

シーンを定型アクションで規定しているのがいけないのか。この定型アクションであるが、これは一応はスクリプト言語を模したものだろう。
スクリプト言語なら、各リモコンやそれに紐づけされるシーンの名前はユニークなものにすべきだろう。そのうえで、入力デバイスを選択し、起動アクションとなるフレーズは、より自由度を与え、入力デバイス毎に重複フレーズを許容するのが然る可き言語体系というものではないだろうか。「照明をつけました」のような出力は、デバイスの選択が可能なので余計に違和感を感じる。

以上、定価で買わず、半額以下のセールで、その中でもセット買いのお得商品に対して、言いたい放題である。消費者というのは時に勝手なものなのである。

なお、Echoシリーズでは、次のEchoShow15から、SoCがAZ2となり、クワッドコア化し、処理能力が向上するとのこと。従来クラウド上で行っていた処理をデバイス上で完結することにより、基本性能が上がり即応性が向上し、人とのコミュニケーションがよりスムーズになるかもしれない。というかなったらいいなぁ。現状では、アレクサと気持ちよくお付き合いするのは難しい。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2021年12月06日 15時52分 (#4164662)

    アレクサ「非リング ミュージックで らせん の サウンドトラックを再生します」

  • by Anonymous Coward on 2021年12月06日 20時46分 (#4164870)

    グループの編集で、Alexa端末を同じグループにしてないと予想。

    • 同じグループにしてるんですけど、うまく動作してくれなくて。ちなみにこのグループって階層化もできるんですね。

      勝手にスクリプト言語のように手続き型を想定していたのですが、もしかしたら、アレクサ君は、自然言語解析的に動作してるのかもしれません。

      「アレクサ、1階のリビングの照明をつけて」

      • 「1階の」

                グループ「1階」もしくはその類語を探す。

      • 「リビングの」

                その配下のグループから「リビング」もしくはその類語(居間等)を探す。

      • 「照明を」

                その配下のデバイスから「照明」もしくはその類語(灯り、シーリングライト等)を探す。

      • 「つけて」

                対象となるデバイスのシーン(リモコンのボタンに該当)から、「つけて」の動作を関連づける名称を探す(「電源」とか「ON」とか)。

      で、今回の場合は、シーリングライトのリモコンが「点燈」「消灯」といった別々のボタンだったので、そのとおりの名称でリモコンのボタンを作成し、それに類したシーン名をつけたのですが、アレクサ君には「つけて」を「点燈」に結べ付けるだけの能力がまだ足りなかったとか。

      よくわかりませんが。

      親コメント
typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...