パスワードを忘れた? アカウント作成
11604827 story
テクノロジー

NTT、電車通過中のガード下でも音声通話や音声認識できるマイク技術を開発 29

ストーリー by hylom
ソフトでやれるの 部門より
あるAnonymous Coward 曰く、

NTTが100dBという高い騒音レベル下でも高品質な通話や音声認識ができる「小型インテリジェントマイク」を開発したそうだ。100dBという騒音レベルは場内や電車通過中のガード下に匹敵するそう。こうした環境でも明瞭な通話や音声認識ができるようになるという(ASCII.jp)。

複数のマイクからの音響信号を処理することで指向性を持たせるビームフォーミング、目的の周波数帯以外を低減するスペクトルフィルタ処理などを使用することにより、目的となる音を劣化させることなく周辺雑音を1000分の1まで低減できるそうだ。ソフトウェアライブラリ「インテリジェント マイクライブラリ(仮称)」として2014年10月から販売するとしている。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 金田朋子の声 [atlusnet.jp]が聞こえなくなったりしませんかね

  • by nemui4 (20313) on 2014年09月29日 15時19分 (#2684649) 日記

    >複数のマイクからの音響信号を処理することで指向性を持たせるビームフォーミング、

    これを使えばスマホとかの小さいマイクとかでも、パーティー会場や雑踏とか大勢いる中で狙った人の会話だけを拾えるように取れるようにのかな。
    取材とかの情報収集活動にも使えそう。

    たまに特定の相手の会話や、駅構内とかでノイズを除去して構内アナウンスだけを聞き取れるようにできるものがあればいいとは思ってた。
    使ったことが無いけど補聴器にもそういうモードが付いていればいいなと思う。

    • by Anonymous Coward on 2014年09月29日 16時49分 (#2684705)

      マイクに対するターゲット音源の距離や方向が変化すれば、その都度フィルタリングのためのパラメータを変えなければなりませんよ。

      それにスマホのような小型デバイスでは、3つのマイクの距離をあまり離して配置できないため、
      マイクから遠く離れた音源を集音の焦点にしようとすると、各マイク間の音源までの距離があまり変わらなくなり、
      焦点がぼやけると思います(つまり音源周りの音を広く拾うようになる)。

      通話に使う場合は、通話時にスマホと音源(口)の位置関係がほぼ固定であらかじめ予想でき、且つ近い、というので出来るのだと思います。

      親コメント
      • by nemui4 (20313) on 2014年09月29日 17時01分 (#2684717) 日記

        >それにスマホのような小型デバイスでは、3つのマイクの距離をあまり離して配置できないため、

        そうかぁ、だめなのか、残念。

        駅構内や電車の中で時々アナウンスが聞き取れなくて困ったときに、スマホの「集音アプリ」というのを幾つか試してみたけど。
        マイクから拾った音にフィルター噛ませてボリューム上げてるようだけど、スマホの処理能力が低いのかディレイがものすごくて直接の音から変にずれて二重に聞こえてしまい余計に聞き取りにくくなって使い物にならなかったのでこういうのが有効になるのかと淡い期待を抱いたけれども散った。
        #ノイズが激しいと聞き分けにくい・・・

        親コメント
    • Re:サウンドスナイプ (スコア:1, フレームのもと)

      by rhodamine (32563) on 2014年09月29日 17時23分 (#2684733)

      否定的なコメントがいくつかついていますが,発想は悪く無いと
      思いますよ.

      スマホにはタッチパネルが付いているので,それをm×nのマイクロフォン
      アレイとして使い,フェーズドアレイで特定の方向の音のみを拾う
      ということが「理論上は」可能です.

      PCの電磁波ノイズから暗号を盗み出せる世の中なので,これくらい
      のSF的発想はありではないでしょうか.

      親コメント
      • by Anonymous Coward on 2014年09月29日 19時28分 (#2684774)

        全然『「理論上は」可能』ではないです。

        繋がった一枚板のタッチパネルを、n x mの独立したマイクとして使うことは出来ません。

        そもそも今一般的にスマホに使われている静電誘導式のタッチパネルでは空気の圧力の変動(=音)は検知できません。
        あれは指が触れたとき、指の圧力を測っているわけではないのです。

        指で押した圧力で検出する抵抗膜方式のマルチタッチ対応タッチパネルもあることにはありますが、
        上述のように一枚板のタッチパネルは隣接する領域からの影響を受けるので、センサーアレイとしては使えません。
        さらにそういった抵抗膜方式でも圧力の強さを測ることができない(触れたか触れないかの1 or 0)ため、マイクとして使うことは出来ません。

        それに何十kHzもの振動を検知できる応答速度がありません。

        親コメント
        • by Anonymous Coward

          訂正: 静電誘導じゃねえわw 「静電容量方式」やね

          要はガラスの表面に目には見えない透明電極で作られたコンデンサが格子状に並んでいて、導体である指がそれらに近づくと
          コンデンサの容量が変化するのでタッチを検出できると言う方式。だから空気の振動は拾えません。

      • by Anonymous Coward

        仲間数人のスマホを連動させて
        カメラで対象を指定して、
        録音して解析、などなど応用は出来そうですね

    • by Anonymous Coward

      雑音含めてマイクで拾えなきゃいけないので距離にもよるでしょう。
      一方、遠くの音を拾うのにパラボラ使う手もありますが、ものすごく目立ちます(笑)

      ※今は亡き「電気通信科学館」で巨大パラボラが10m以上離して設置してあって小声でもよく聞こえたのを思い出す。

    • by Anonymous Coward

      人間はカクテルパーティー効果 [wikipedia.org]で似たようなことをやってるのでそれに近いことを人工的にできるようになってきたということですね。

      • by Anonymous Coward

        それは人の口の開き方、タイミングで声の主を判断しているだけで、
        仕組みは違う。

    • by Anonymous Coward

      ASCIIの画像を見る限り、そんなにマイクを離しておくシステムじゃなく、
      小さなマイクを3つ並べて置いてるだけですよね。
      図と同じ配置で効果があるなら、
      スマホに内蔵することがそんなに難しいとは思えないのですが。

      どの程度の大きさや距離で効果があるのかわからないので、単なる想像ではあります。

      • by Anonymous Coward

        異なる位置のマイクに届く音声の位相差を利用する方式ではなく、指向性のあるマイクをそれぞれ別方向に向けて
        音声と環境騒音をマイクの方向で分離して収集し、引き算する方式みたいですね。

        これ、本当に他の方向に向けたマイクが必要なんでしょうか。指向性の良いマイク一本を話者に向けるだけで済むような気も。

        ともあれ、これだと離れた位置の音源を拾おうとする場合、ターゲットの本命音源を狙うマイクと音源の間を結ぶ線上に、
        もし他の雑音音源が存在したら、そこから出る音は除去不可能だと思います。

        装置はスマホサイズには収まりますが、それでパーティーなどで離れた位置の音を拾うのはやはり難しいんじゃないですかね。

        • by kokushoku (36258) on 2014年09月30日 9時03分 (#2684991)
          『安価な汎用のマイク素子』とあるので、指向性マイクではなく複数の通常のマイクを
          位相差を利用したビームフォーミング処理で方向ごとの音源に分離、特定方向の音のみ抽出し、
          さらに環境音を減らすというだけでは?

          通話用の処理のままだと離れた位置の音を拾うのは難しそうですが、
          パラメータを変えるだけで単純な指向性マイクアレイとして利用できそう
          親コメント
  • by Anonymous Coward on 2014年09月29日 14時08分 (#2684604)

    こちらが聞き取れないレベルの環境じゃ意味がないのでは…

    • by Anonymous Coward on 2014年09月29日 15時10分 (#2684644)

      スピーカーはイヤーマフ兼の密閉型のヘッドホン使う手がありますけど
      マイクはそういうわけにはいかなかったので、意味あるかと。
      西住殿がクビに付けた骨伝導マイクで話すときは手で抑えて使ってましたが、それも必要なくなりますし。

      親コメント
      • by Anonymous Coward
        西住殿がつけてるのは咽喉マイクってやつだよ。
        仕組みは骨伝導では無いはずです。たぶん
        • by Anonymous Coward

          区別ついてなかったです。 指摘ありがとう。
          咽喉マイクは喉の振動を直接拾ってる様ですね。

    • by love-m4 (10412) on 2014年09月29日 14時17分 (#2684607) 日記

      骨伝導とセットにしましょうか。

      親コメント
    • by Anonymous Coward

      次はガード下でも聞こえるスピーカーですね!

      • by Anonymous Coward

        若者には聞こえるが年寄りには聞こえないんですね

        #あれはスピーカーじゃなくて音の方の話だったっか

    • by Anonymous Coward

      それもあるし、慣れないと大声で喋ってしまって、
      向こう側には周りが静かなのに大声だと苛つかれそう。

      • by Anonymous Coward on 2014年09月30日 2時02分 (#2684916)

        逆だ。 実際にやってみると、周囲の騒音が大きい方が普通の声でしゃべるんだな、これが。
        そういう環境で電話するのに慣れてるから。 静かな方が「聞こえますかーーーー!!」とか
        大声で何度も怒鳴ってて、周囲が静かなだけに、もう、本当にうるさくてかなわん。
        これが現実。 周囲の騒音で聞こえないだろうと、最初はかなり心配したけど、実際やってみたら、
        なんてことはなく聞こえているらしく、普通の声の大きさでしゃーしゃーとしゃべってくる。
        逆になるということがわかって、ものすごいショックだった。 静かな方は、相手の騒音がモロに
        聞こえてくるので、聞こえないだろうと思い込んで、騒音に負けないように大声張り上げるんだよ。
        工場の現場の人にPHS内線電話機をもたせた時のはなしだけど(笑

        親コメント
    • by Anonymous Coward

      聞く方は、イヤホン使うとかなり改善されますよね。
      マイクはなかなかそうは行かないので(ヘッドセットでもかなり雑音ひろう)、
      開発されたと思います。

    • by Anonymous Coward

      入力音声信号から話者の音声と外部雑音成分を分離できたのだから、今度はその外部雑音成分の情報を使って、
      スピーカー側ではアクティブノイズキャンセリングをかければよいのではないだろうか?

  • by Anonymous Coward on 2014年09月29日 18時47分 (#2684763)

    100dBという騒音レベルは場内や電車通過中のガード下に匹敵するそう。

    「場内」ってどこよ。コミケの会場とかか?
    と思ったら,リンク先では「工場内」だった。

  • by Anonymous Coward on 2014年09月29日 21時59分 (#2684838)

    これで、

    少女:あ…あの…実は……

    騒音

    少年:なにか言った?

    というシチュエーションがなくなるかと思うとメシウマです!

  • by Anonymous Coward on 2014年09月30日 16時41分 (#2685203)

    次期iPhoneに搭載させようぜ!!
    これでさらにドコモは質が高い音声回線になるね

typodupeerror

あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー

読み込み中...