アカウント名:
パスワード:
みんなベイジアンフィルタを使ってないんですか?
どんなメールにも、(少なくともヘッダには)文字データが必ず入っているので、ベイジアンフィルタはspamの特徴を見付けてくれます。そりゃ実装が不十分な場合も多いでしょうけど。
ワタシはPOPFile [sourceforge.net]を使ってますけど、この種のメールも含めてきれいにフィルタリングしてくれて、ほとんど間違えませんね。画像だけというメールはヘッダから拾ったmultipartあたりをspamの特徴として拾ってくれます。hamの場合は、hamらしい他の単語を拾ってちゃんとhamとして認識してくれますよ。
ベイジアンフィルタのいいところは、あまりフィルタを作るのに努力しなくても優秀なフィルタを得られるところにあります。届いたメールがhamであるかspamであるかの切り分けをただ続けていけばいいだけですから。
ワタシが使っているのはPOPFileですが、コイツをIMAPで使うのがspam対策の決定版だと思ってます。やることは間違って振り分けられたメールを見付けたら、正しいフォルダに移動するだけです。これだけで、検出率99%(ワタシのところではこれぐらいか、もっと高い)のフィルタが得られるんですから優秀ですよ。
どちらにしろ、万能なツールはないわけですから、補助的にルールを作っていくのは当然としても、せっかくたいして努力をしないのに95%の検出率が得られているんですからそれを捨てるのはもったいないと思うです。あと、95%ってベイジアンフィルタを使ってる割には低い数字だと思うんですけど、ちゃんと日本語に対応したものを使ってますか? 日本語に対応してたとしても、N-gramだとそんなもんかも知れない。日本語の単語をうまく認識する辞書を持っているタイプじゃないとなかなか検出率は上がらないです。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
最初のバージョンは常に打ち捨てられる。
こういう記事を見るたびに思うのですが、 (スコア:1)
みんなベイジアンフィルタを使ってないんですか?
どんなメールにも、(少なくともヘッダには)文字データが必ず入っているので、ベイジアンフィルタはspamの特徴を見付けてくれます。そりゃ実装が不十分な場合も多いでしょうけど。
ワタシはPOPFile [sourceforge.net]を使ってますけど、この種のメールも含めてきれいにフィルタリングしてくれて、ほとんど間違えませんね。画像だけというメールはヘッダから拾ったmultipartあたりをspamの特徴として拾ってくれます。hamの場合は、hamらしい他の単語を拾ってちゃんとhamとして認識してくれますよ。
ベイジアンフィルタ使ってはいますが (スコア:1)
日に100件程度であれば漏れるのは5件だからあまり気にならないかもしれませんが、業務で使うメールには多いときは一晩で3000件くらい溜まってたりしますので、その5%となると150件。
さらに間違ってスパム判定を受けてしまった、正常なメールの採掘作業が必要になりますので、結局最後は人間の目を頼ることになります。
なので最近はメールソフトの自前フィルタ設定に戻ろうかと思っているところです。
#最後に信じるのは自分
Re:ベイジアンフィルタ使ってはいますが (スコア:1)
ベイジアンフィルタのいいところは、あまりフィルタを作るのに努力しなくても優秀なフィルタを得られるところにあります。届いたメールがhamであるかspamであるかの切り分けをただ続けていけばいいだけですから。
ワタシが使っているのはPOPFileですが、コイツをIMAPで使うのがspam対策の決定版だと思ってます。やることは間違って振り分けられたメールを見付けたら、正しいフォルダに移動するだけです。これだけで、検出率99%(ワタシのところではこれぐらいか、もっと高い)のフィルタが得られるんですから優秀ですよ。
どちらにしろ、万能なツールはないわけですから、補助的にルールを作っていくのは当然としても、せっかくたいして努力をしないのに95%の検出率が得られているんですからそれを捨てるのはもったいないと思うです。あと、95%ってベイジアンフィルタを使ってる割には低い数字だと思うんですけど、ちゃんと日本語に対応したものを使ってますか? 日本語に対応してたとしても、N-gramだとそんなもんかも知れない。日本語の単語をうまく認識する辞書を持っているタイプじゃないとなかなか検出率は上がらないです。
Re:ベイジアンフィルタ使ってはいますが (スコア:0)
評価していて気づいたのですが、それまで目視で振り分けていた
メールに数%の振り分けミス(hamなのにspamに振り分け)があることが
わかりました。ベイジアンフィルタでもfalse positive (hamなのに
spam判定)がたまに出ますが、自分がやるミスよりは少ないのです。
ただ、ベイジアンフィルタの性能は受け取るメールの性質によって
変わってくるでしょうから、一般的に適用できると主張するつもりは
ありません。結局、自分に合った方法を探さなければならないでしょう。