アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家
精度 (スコア:-1, フレームのもと)
それとも、99.999%あたりを十分な精度としているのかな?
Re:精度 (スコア:1)
最近のspamはスコアの高い単語を並べまくったものばかりだよ。
自分がもし本気のspammerだったら、そのくらいするでしょ。
技術系MLのアーカイブからメールを引っこ抜いて、URL部分だけ変えるとかさ。
Re:精度 (スコア:0)
以前のスパム判別ソフトウェアはその程度の実装で、簡単にだまくらかされてました。
で、それじゃダメなのでベイジアンフィルタとなったわけです。
ベイジアン=ベイズ統計ってのは、事後の確率から事前の確率を求める手法です。
Re:精度 (スコア:1, 興味深い)
手元のDBにはボディブロウのように効いてきていると感じます。
bogofilterやbsfilterでのフィルタリングは通用しなくなり、とうに諦めました。
今もベイジアンフィルタでOKという人は、何を使っているんでしょうか。
また、どのくらいの量のspamを受け取っているんでしょうか。
Re:精度 (スコア:1)
途中で誤学習した可能性があるので、一度リセットしてみたらどうですか?
Re:精度 (スコア:1)
私個人のメールアドレスでのここ数日の状況は、一日あたりの
spamは130通程度、spamでないものが40通ぐらいとなっています。
POPFileのコントロールパネルに表示されている分類精度は99.84%
となっていますが、実際にはわずかにそれを下回るぐらいかと思い
ます。最近再学習させていないので、1日に1~2通判定を通り抜け
てくるspamがあるもので。
個人のメールアドレスだとか、ここ何年かはサイトやBBSではこ
のメールアドレスを出していない(ユーザー登録などには使用)とか、
メーリングリストはソフトメーカーのサポート系ぐらいしか入って
いないとか、最新の(?)spamを送るようなところから来ていないだ
けかもしれませんが、私の場合はこれでほとんど大丈夫です。
Re:精度 (スコア:1)
ました。期間が3年弱で、判定したメール総数が10万通ほどです。
年々spamが増えていて、今年は月に3000通を突破……。
Re:精度 (スコア:0)
Re:精度 (スコア:0)
だいたい日に 200 ~ 400 通来ます。
漏れるのは数通/日程度です。
学習は 30000 通くらい学習させました。
いまは、学習させてません。
数通なら手で削除する程度で邪魔じゃないからです。
一日あたり 100 通くらいで手作業とかホワイトリスト・ブラックリスト方式では耐えられなくなりました。