アカウント名:
パスワード:
こういうのは理想環境で実験しており、実際の環境では使い物にならないでしょう。電車の走行音・手を動かすときに洋服がずれる音・呼吸音・他の人の動作音など様々な音が干渉しますからね。
私は「耳コピ」と呼ばれる耳コピーした音を譜面に書き起こす採譜作業をやってますが、一般のJ-POPのCD音源のようなノイズの少ない音からボーカルの声の採譜をするような簡単な作業ですら、AIにはまともにできないのです。
できると謳っている最新のAIシステムはありますが、どれも使い物にならないのです。バックコーラスやハモリ、エフェクトなどが少しでもあったら滅茶苦茶に採譜されてしまいます。
最近はAIは~~、と成果ばっかり宣伝する行為が盛んにおこなれていますが、研究者の方も実は実用レベルにすることは不可能だと内心は知りつつも、仕事として給料がもらえるので内心はそれで将来利益を生み出すことができないことはわかっていても「研究のための研究」をしている人が結構いるとAI技術者と話したことのある人から聞いたことがあります。AI開発関係企業に投資する投資信託などの商品も盛んに宣伝されていますが、騙されないように注意した方が良いです。
>静かな環境の中で発話者にマイクの前に立ってもらいノイズのない音を取れば、日本の音声認識でも100%近い精度を出せるのだとか。>問題はノイズのない状況をどう作るか。またマイクから離れた発話者の声をどう正確にひろうか。>Amazonのfar-field音声認識技術は、そこをAIでクリアしたようだ。>Amazonがクラウド上に持つ膨大なコンピューティングパワー、新たな機械学習のアルゴリズム、それを賢くするための大量のデータ。>この3つが揃った状態だからこそ、マイクから離れた場所の音声でも正確に拾えるようになったのだという。
米AmazonのAI研究者が来日したので、Alexaの仕組みについて聞いてみたhttps://aishinbun.com/talk/20180416/1337/ [aishinbun.com]
これ例えば壁の後ろに柱があるかどうかで反響音が変わって非破壊検査が出来るってヤツのスマホ逆用版だぞ建築業界じゃ既に当たり前に使ってる(てかホームセンターにも売ってる)その技術がまさかスマホタップなみの音の小ささでも使えるとはったニュース知り合いの知り合いが言ってたってのを鵜呑みにする人はもうちょっと騙されないようにした方が良い
AIもどき投資詐欺で逮捕されないようにね
知り合いの知り合いが言うには何て情報をエビデンスも取らずに信用することはないので大丈夫ですよw
なにしろその中にはテロリストだっているくらいやからなー。w
元コメのどこにも書いてない「知り合いの知り合い」にこだわって相手を攻撃し出して妄想する君が一番頭悪そう
> AI技術者と話したことのある人から聞いたことがあります元コメのACから見れば、「人」=知り合い、「AI技術者」=知り合いの知り合い。
日本語読めてないから頭悪そうじゃなくて頭悪いね、君
「「AI技術者」(Aさん)と話したことのある人」(Bさん)から聞いた(コメ主)
さすがに例えが雑すぎ。学生の頃、稼働中の機械や構造物を超音波で非破壊検査する研究やってたけど信号とノイズとの分離がキモだった。音声認識で使用され始めてたニューラルネットワークでアプローチしたけど散々だったな。まぁ今とはPCのパワーもAI技術も比べ物にならんが。
しかしだ。実はごく簡単にノイズキャンセリングヘッドホンのキャンセル部で環境音を圧倒的に落とせたりも。まあターゲットの音自体を理解してちゃんとフィルターを作ればそこそこイケる。
#自分は6軸加速度センサーでピックアップ作って直接近くに設置したけど。
高価なAIと高スペックPCを買うより安く使えるうちは人力ですよね何時までもその仕事があればいいですけど
音楽(周波数帯は実質全域)とタップ音(機種ごとに周波数帯はほぼ固定)で必要な技術レベルの区別もつかない耳コピ職人だと仕事なくなるのは早そうだな
> している人が結構いるとAI技術者と話したことのある人から聞いたことがあります
伝聞が過ぎるやろ。確度0%。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall
現代のAIはノイズ音をまともに処理できません (スコア:0)
こういうのは理想環境で実験しており、実際の環境では使い物にならないでしょう。
電車の走行音・手を動かすときに洋服がずれる音・呼吸音・他の人の動作音など様々な音が干渉しますからね。
私は「耳コピ」と呼ばれる耳コピーした音を譜面に書き起こす採譜作業をやってますが、
一般のJ-POPのCD音源のようなノイズの少ない音からボーカルの声の採譜をするような簡単な作業ですら、AIにはまともにできないのです。
できると謳っている最新のAIシステムはありますが、どれも使い物にならないのです。
バックコーラスやハモリ、エフェクトなどが少しでもあったら滅茶苦茶に採譜されてしまいます。
最近はAIは~~、と成果ばっかり宣伝する行為が盛んにおこなれていますが、研究者の方も実は実用レベルにすることは不可能だと内心は知りつつも、
仕事として給料がもらえるので内心はそれで将来利益を生み出すことができないことはわかっていても「研究のための研究」をしている人が結構いるとAI技術者と話したことのある人から聞いたことがあります。
AI開発関係企業に投資する投資信託などの商品も盛んに宣伝されていますが、騙されないように注意した方が良いです。
Re:現代のAIはノイズ音をまともに処理できません (スコア:1)
>静かな環境の中で発話者にマイクの前に立ってもらいノイズのない音を取れば、日本の音声認識でも100%近い精度を出せるのだとか。
>問題はノイズのない状況をどう作るか。またマイクから離れた発話者の声をどう正確にひろうか。
>Amazonのfar-field音声認識技術は、そこをAIでクリアしたようだ。
>Amazonがクラウド上に持つ膨大なコンピューティングパワー、新たな機械学習のアルゴリズム、それを賢くするための大量のデータ。
>この3つが揃った状態だからこそ、マイクから離れた場所の音声でも正確に拾えるようになったのだという。
米AmazonのAI研究者が来日したので、Alexaの仕組みについて聞いてみた
https://aishinbun.com/talk/20180416/1337/ [aishinbun.com]
Re: (スコア:0)
これ例えば壁の後ろに柱があるかどうかで反響音が変わって非破壊検査が出来るってヤツのスマホ逆用版だぞ
建築業界じゃ既に当たり前に使ってる(てかホームセンターにも売ってる)
その技術がまさかスマホタップなみの音の小ささでも使えるとはったニュース
知り合いの知り合いが言ってたってのを鵜呑みにする人はもうちょっと騙されないようにした方が良い
Re: (スコア:0)
AIもどき投資詐欺で逮捕されないようにね
Re: (スコア:0)
知り合いの知り合いが言うには何て情報をエビデンスも取らずに信用することはないので大丈夫ですよw
Re:現代のAIはノイズ音をまともに処理できません (スコア:2)
なにしろその中にはテロリストだっているくらいやからなー。w
Re: (スコア:0)
元コメのどこにも書いてない「知り合いの知り合い」にこだわって相手を攻撃し出して妄想する君が一番頭悪そう
Re: (スコア:0)
> AI技術者と話したことのある人から聞いたことがあります
元コメのACから見れば、「人」=知り合い、「AI技術者」=知り合いの知り合い。
Re: (スコア:0)
日本語読めてないから頭悪そうじゃなくて頭悪いね、君
「「AI技術者」(Aさん)と話したことのある人」(Bさん)から聞いた(コメ主)
Re: (スコア:0)
さすがに例えが雑すぎ。
学生の頃、稼働中の機械や構造物を超音波で非破壊検査する研究やってたけど信号とノイズとの分離がキモだった。
音声認識で使用され始めてたニューラルネットワークでアプローチしたけど散々だったな。
まぁ今とはPCのパワーもAI技術も比べ物にならんが。
Re: (スコア:0)
しかしだ。
実はごく簡単にノイズキャンセリングヘッドホンのキャンセル部で環境音を圧倒的に落とせたりも。
まあターゲットの音自体を理解してちゃんとフィルターを作ればそこそこイケる。
#自分は6軸加速度センサーでピックアップ作って直接近くに設置したけど。
Re: (スコア:0)
高価なAIと高スペックPCを買うより安く使えるうちは人力ですよね
何時までもその仕事があればいいですけど
Re: (スコア:0)
音楽(周波数帯は実質全域)とタップ音(機種ごとに周波数帯はほぼ固定)で必要な技術レベルの区別もつかない耳コピ職人だと仕事なくなるのは早そうだな
Re: (スコア:0)
> している人が結構いるとAI技術者と話したことのある人から聞いたことがあります
伝聞が過ぎるやろ。確度0%。