アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日々是ハック也 -- あるハードコアバイナリアン
難しくてようわからんのですが (スコア:3, 興味深い)
著作権を侵害する歌曲が含まれているかを検出しようと思ったとき、
ラジオの音声データに対して、データベースから歌の音声データを
一つ一つ照らし合わせていたら膨大な計算量になるから、何かを特徴データ(hash)として、
より小さなデータベースでより少ない計算量でパターンマッチングが出来る、って感じですかね?
統計データを元にしたハッシュの生成だと、色々なノイズが加わったり
再圧縮を受けたりすると全く別の物になってしまうので、そのような影響を
受けないハッシュの作り方を見つけるのがこの手の技術のポイントってこと?
例えば音声データに対しては音声認識技術を使ってテキストを抽出してそれをハッシュにするとか。
ごめんなさい。
Re:難しくてようわからんのですが (スコア:0)
「高速だけどおおざっぱな判定をする手法」で対象を絞り「精度は高いが計算に時間がかかる手法」でさらに対象を絞り、(場合によってはさらに絞り込んで)、最後の判定は人間が、という方法もありえます。
「数が多過ぎて人手ですべては無理」でも「プログラムによる完全な判定も無理」というときに使えるかと。
Re:難しくてようわからんのですが (スコア:0)
まず最初に「アニメか映画かホームビデオか」で絞り込むだけで相当効率上がるのが悲しいところ。
Re:難しくてようわからんのですが (スコア:0)
Re:難しくてようわからんのですが (スコア:0)