パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

ベイズ推定で楽々スパムメールをフィルタリング」記事へのコメント

  • 本家では (スコア:2, 参考になる)

    by za (16346) on 2003年08月27日 14時15分 (#386597)
    SPAM発祥の地の本家では度々 [slashdot.org]取り上げられています。
    結構なコメントの量なのですが、こんな時に閾値5が
    役立ちます。スラドにベイズフィルタを適応するという
    アイディアもありました。

    Seven Spam Filters Compared [slashdot.org]の元記事(綺麗なコストカーブ [freshmeat.net]あり)ではPOPFileは比べられていないのですが、コメントにPOPFileが一番というコメントもありました。

    • by za (16346) on 2003年08月27日 15時21分 (#386634)
      スラドの投稿にベイズフィルタという案は少し考えが足りませんでした。cid=6043099 [slashdot.org]で、ベイズフィルターは各個人のフィルター(コーパス)やフィルタリングの結果をスパマーが見ることができないというのが肝ということが分かったからです。掲示板にベイズフィルタを適応しても、スパマーが投稿できなかったということがわかるので、投稿できるまで粘るスパマーには意味ないわけです。

      他方2chブラウザのようなクライアント側でベイズフィルタ使うのはNGワードよりよっぽど理にかなっています。そもそもスパムでない投稿をスパムと誤っても被害極小でしょうし、、、ベイズフィルタ付きの掲示板クライアントがあればなぁと思います(*)。

      スパム業者は多くのユーザーのフィルターを一気に知る方法がないので、多くのフィルターを通り抜けるメールを作成することが難しいわけです。(業者は業者でわざと他の業者のスパムをオプトインして色々なフィルターを作って、そのフィルターを通る新しいスパムを日々開発しているのでしょう。)

      学習すればするほど、賢くなるのだから、コーパス共有すればいいのに、、、と思っていましたが、別々に学習し、お互いに学習したことを知らないがために、システムとして賢くなるのですね、、、

      (*)プログラマじゃないので、作れ!とかいわないでください・・・

      #恥ずかしいけど流れ上ID

      親コメント
      • by ikemo (901) on 2003年08月30日 0時46分 (#388276)
        他方2chブラウザのようなクライアント側でベイズフィルタ使うのはNGワードよりよっぽど理にかなっています。そもそもスパムでない投稿をスパムと誤っても被害極小でしょうし、、、ベイズフィルタ付きの掲示板クライアントがあればなぁと思います(*)。
        そのアイデアいいなぁ。Kita [osdn.jp]に組み込もうかな。
        /.も対応したいんですが、簡単にコメントを取得する方法がなさそうなのでちょっと難しいっす。
        親コメント

アレゲは一日にしてならず -- アレゲ見習い

処理中...