パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

NTT、電車通過中のガード下でも音声通話や音声認識できるマイク技術を開発」記事へのコメント

  • by nemui4 (20313) on 2014年09月29日 15時19分 (#2684649) 日記

    >複数のマイクからの音響信号を処理することで指向性を持たせるビームフォーミング、

    これを使えばスマホとかの小さいマイクとかでも、パーティー会場や雑踏とか大勢いる中で狙った人の会話だけを拾えるように取れるようにのかな。
    取材とかの情報収集活動にも使えそう。

    たまに特定の相手の会話や、駅構内とかでノイズを除去して構内アナウンスだけを聞き取れるようにできるものがあればいいとは思ってた。
    使ったことが無いけど補聴器にもそういうモードが付いていればいいなと思う。

    • by Anonymous Coward on 2014年09月29日 16時49分 (#2684705)

      マイクに対するターゲット音源の距離や方向が変化すれば、その都度フィルタリングのためのパラメータを変えなければなりませんよ。

      それにスマホのような小型デバイスでは、3つのマイクの距離をあまり離して配置できないため、
      マイクから遠く離れた音源を集音の焦点にしようとすると、各マイク間の音源までの距離があまり変わらなくなり、
      焦点がぼやけると思います(つまり音源周りの音を広く拾うようになる)。

      通話に使う場合は、通話時にスマホと音源(口)の位置関係がほぼ固定であらかじめ予想でき、且つ近い、というので出来るのだと思います。

      親コメント
      • by nemui4 (20313) on 2014年09月29日 17時01分 (#2684717) 日記

        >それにスマホのような小型デバイスでは、3つのマイクの距離をあまり離して配置できないため、

        そうかぁ、だめなのか、残念。

        駅構内や電車の中で時々アナウンスが聞き取れなくて困ったときに、スマホの「集音アプリ」というのを幾つか試してみたけど。
        マイクから拾った音にフィルター噛ませてボリューム上げてるようだけど、スマホの処理能力が低いのかディレイがものすごくて直接の音から変にずれて二重に聞こえてしまい余計に聞き取りにくくなって使い物にならなかったのでこういうのが有効になるのかと淡い期待を抱いたけれども散った。
        #ノイズが激しいと聞き分けにくい・・・

        親コメント
    • Re:サウンドスナイプ (スコア:1, フレームのもと)

      by rhodamine (32563) on 2014年09月29日 17時23分 (#2684733)

      否定的なコメントがいくつかついていますが,発想は悪く無いと
      思いますよ.

      スマホにはタッチパネルが付いているので,それをm×nのマイクロフォン
      アレイとして使い,フェーズドアレイで特定の方向の音のみを拾う
      ということが「理論上は」可能です.

      PCの電磁波ノイズから暗号を盗み出せる世の中なので,これくらい
      のSF的発想はありではないでしょうか.

      親コメント
      • by Anonymous Coward on 2014年09月29日 19時28分 (#2684774)

        全然『「理論上は」可能』ではないです。

        繋がった一枚板のタッチパネルを、n x mの独立したマイクとして使うことは出来ません。

        そもそも今一般的にスマホに使われている静電誘導式のタッチパネルでは空気の圧力の変動(=音)は検知できません。
        あれは指が触れたとき、指の圧力を測っているわけではないのです。

        指で押した圧力で検出する抵抗膜方式のマルチタッチ対応タッチパネルもあることにはありますが、
        上述のように一枚板のタッチパネルは隣接する領域からの影響を受けるので、センサーアレイとしては使えません。
        さらにそういった抵抗膜方式でも圧力の強さを測ることができない(触れたか触れないかの1 or 0)ため、マイクとして使うことは出来ません。

        それに何十kHzもの振動を検知できる応答速度がありません。

        親コメント
        • by Anonymous Coward

          訂正: 静電誘導じゃねえわw 「静電容量方式」やね

          要はガラスの表面に目には見えない透明電極で作られたコンデンサが格子状に並んでいて、導体である指がそれらに近づくと
          コンデンサの容量が変化するのでタッチを検出できると言う方式。だから空気の振動は拾えません。

      • by Anonymous Coward

        仲間数人のスマホを連動させて
        カメラで対象を指定して、
        録音して解析、などなど応用は出来そうですね

    • by Anonymous Coward

      雑音含めてマイクで拾えなきゃいけないので距離にもよるでしょう。
      一方、遠くの音を拾うのにパラボラ使う手もありますが、ものすごく目立ちます(笑)

      ※今は亡き「電気通信科学館」で巨大パラボラが10m以上離して設置してあって小声でもよく聞こえたのを思い出す。

    • by Anonymous Coward

      人間はカクテルパーティー効果 [wikipedia.org]で似たようなことをやってるのでそれに近いことを人工的にできるようになってきたということですね。

      • by Anonymous Coward

        それは人の口の開き方、タイミングで声の主を判断しているだけで、
        仕組みは違う。

    • by Anonymous Coward

      ASCIIの画像を見る限り、そんなにマイクを離しておくシステムじゃなく、
      小さなマイクを3つ並べて置いてるだけですよね。
      図と同じ配置で効果があるなら、
      スマホに内蔵することがそんなに難しいとは思えないのですが。

      どの程度の大きさや距離で効果があるのかわからないので、単なる想像ではあります。

      • by Anonymous Coward

        異なる位置のマイクに届く音声の位相差を利用する方式ではなく、指向性のあるマイクをそれぞれ別方向に向けて
        音声と環境騒音をマイクの方向で分離して収集し、引き算する方式みたいですね。

        これ、本当に他の方向に向けたマイクが必要なんでしょうか。指向性の良いマイク一本を話者に向けるだけで済むような気も。

        ともあれ、これだと離れた位置の音源を拾おうとする場合、ターゲットの本命音源を狙うマイクと音源の間を結ぶ線上に、
        もし他の雑音音源が存在したら、そこから出る音は除去不可能だと思います。

        装置はスマホサイズには収まりますが、それでパーティーなどで離れた位置の音を拾うのはやはり難しいんじゃないですかね。

        • by kokushoku (36258) on 2014年09月30日 9時03分 (#2684991)
          『安価な汎用のマイク素子』とあるので、指向性マイクではなく複数の通常のマイクを
          位相差を利用したビームフォーミング処理で方向ごとの音源に分離、特定方向の音のみ抽出し、
          さらに環境音を減らすというだけでは?

          通話用の処理のままだと離れた位置の音を拾うのは難しそうですが、
          パラメータを変えるだけで単純な指向性マイクアレイとして利用できそう
          親コメント

コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell

処理中...