officepigの日記: Netskyも山のように来てウザイけど 3
日記 by
officepig
このスパム、発信元アドレスしょっちゅう変えて送りつけてきてウザすぎ。
#ちなみに下のURL、クッキー出してくる出会い系サイトなのでアクセスしないほうが吉。
========
Subject: アドレス変更しました♪
--------
ヨロシクお願いしますm(--)m→ http://www.miss-you.jp/?P05 あかね☆
このスパム、発信元アドレスしょっちゅう変えて送りつけてきてウザすぎ。
#ちなみに下のURL、クッキー出してくる出会い系サイトなのでアクセスしないほうが吉。
========
Subject: アドレス変更しました♪
--------
ヨロシクお願いしますm(--)m→ http://www.miss-you.jp/?P05 あかね☆
日々是ハック也 -- あるハードコアバイナリアン
ふむ! (スコア:1)
「あかね」を学習させるべく、わざわざipadicの人名辞書から「かな/カナ表記人名辞書」
まででっちあげたというのに。
どうも、出現頻度が低いのか、「あ/かね」としか切ってくれないです。rubyのmatzさもも、
「まつ/もと/ゆきひろ」となっちゃうんだよな。
#やっぱり、kakasiのわかち書きモードにするんだったか。
Re:ふむ! (スコア:1)
最近は会社からアクセスしてないため
他の方の日記を読むことが滅多になくなってて
こうやってどなたかに来ていただけると非常にうれしいです。
で、このスパム、ご丁寧にメールアドレス・発信者・本文中の名前(らしきもの)
それぞれ、度々変わって届いてます。
いや、URLの?から後ろも変わってるな。
ですので、フィルタリングはかなり厳しいと思われます。
文中のURLではじいちゃうのが一番いいかも。
Re:ふむ! (スコア:1)
bogofilterは単純なパターンマッチではなくて、いわゆるベイジアンフィルタってやつで、
ワード単位でspamメール、hamメール内のカウントしますから、IPアドレス、メールアドレス、
文中の単語など全部記憶します。だから、正しくワードを区切れればそれで勝ったも同然です。
ワードに区切るためのプログラムを、chasenからkakasiに変えたら、ちゃんと弾くようになり
ました。
力業ですし、100%弾くわけでもありませんが、いちいち自分でパターンを設定するのに比べて、
ものすごく楽です。パターンマッチでの振り分けは、spamを弾いた後でやるようにしています。
そちらの環境で簡単に使えるものがあるかわかりませんが、使ってみるとよいですよ。