kinnekoの日記: spam な時代 5
日記 by
kinneko
8年くらい使っているあるメールアカウントの状況。
4月の着信は1100件強くらい。
そのうち、spam は 43%。500通弱ある。
日本語の spam は、たったの 20 通くらい。
そのほとんどが海外からの英語 spam である。
これはもはや尋常ではない事態ですな。
びっくりするのは、rapiddealsbyemail.com をのぞいて、3 通以上
の同じ差し出し人からのメールはなく(同じ送信リストに重複登録
されていたと思われるものは除く)、同じサブジェクトでのメール
は最大5通のものがあっただけで、ほとんど1、2通しかない事。
ここまでバラバラだと機械的に除去するのも難しいと思われる。
ISP のサーバー側でバルク送信されてくるものは拒否するのが有
効かもしれないが、ML も同じ方法なのでちょっと難しい。
spam の除去はウイルス除去よりビジネスになるかもしれないけど、
ウイルスと違って除去パターンを確定するのは難しそうね。
Conceptbase なエンジンを使って、内容要約した結果、一般的な
セールスであれば捨てるというようなインテリジェント化が必要
でしょうね。just さん、やらないの?
メールクライアントの機能として (スコア:1)
家計簿みたいですが
「家族・友人とのやりとり」・・・4%
「仕事」・・・7%
「スパム・広告」・・・85%
「その他」・・・4%
みたいなものを出力してくれるというもの。
- Ryuzi Kambe -
Re:メールクライアントの機能として (スコア:1)
「わたしの所には spam しか来ない」とか
「うちには spam も来やしない...」とか。
ふつーな方のメール受信数って、そんな感じじゃないかな。
私の場合 (スコア:1)
約3,200通
spam
884通(日本語なもの約10通)
ウィルス
10通(全てKLEZ.H)
改めて数えてみましたが日に30件は届いてます。
殆どWin32な環境なので秀丸の姉妹品の鶴亀メール使ってますが
spam用のfilter設定だけで200程度登録してます。
英語のメールは基本的にはやり取りすることは無いので
Content-TypeやFrom:のカントリーコードで落とす設定が多いですね。
設定の(こくごく)一部
広告
"Subject:" が "!広告!" を含む または
"Subject:" が "!広告!" を含む または
"Subject:" が "!広告!" を含む
→ "SPAM"に移動する
未承諾広告、未許諾広告、末承諾広告
"Subject:" が "未承諾広告" を含む または
"Subject:" が "未承認広告" を含む または
"Subject:" が "末承諾広告" を含む
→ "SPAM"に移動する
ADV:
"Subject:" が "ADV" の単語を含む
→ "SPAM"に移動する
iso-8859-1,iso-8859-2,ks_c_5601-1987
"Content-Type:/X-Body-Content-Type:" が "iso-8859-1" を含む または
"Content-Type:/X-Body-Content-Type:" が "iso-8859-2" を含む または
"Content-Type:/X-Body-Content-Type:" が "ks_c_5601-1987" を含む
→ "SPAM"に移動する
Windows-1252、GB2312_CHARSET、multipart/related;
"Content-Type:/X-Body-Content-Type:" が "Windows-1252" を含む または
"Content-Type:/X-Body-Content-Type:" が "GB2312_CHARSET" を含む または
"Content-Type:" が "multipart/related;" を含む
→ "SPAM"に移動する
Windows-1251、ks_c_5601、multipart/alternative; boundary="=_NextPart
"Content-Type:/X-Body-Content-Type:" が "Windows-1251" を含む または
"Content-Type:/X-Body-Content-Type:" が "ks_c_5601" を含む または
"Content-Type:/X-Body-Content-Type:" が "multipart/alternative; boundary=\"=_NextPart" を含む
→ "SPAM"に移動する
text/html; charset=US-ASCII
"Content-Type:" が "text/html;" の単語を含む かつ
"Content-Type:" が "US-ASCII" の単語を含む
→ "SPAM"に移動する
default、WC_MAIL、boundaryboundary
"Content-Type:" が "default" の単語を含む または
"Content-Type:" が "WC_MAIL" を含む または
"Content-Type:" が "boundaryboundary" を含む
→ "SPAM"に移動する
charset="DEFAULT_CHARSET"、windows-1250
"Content-Type:" が "charset=\"DEFAULT_CHARSET\"" を含む または
"Content-Type:" が "windows-1250" の単語を含む を
→ "SPAM"に移動する
unknown-8bit
"Content-Type:" が "unknown-8bit" を含む
→ "SPAM"に移動する
前年同月比5倍 (スコア:1)
http://srad.jp/journal.pl?op=display&uid=10903&id=124479
Re:前年同月比5倍 (スコア:1)
すでにどうしようもない S/N 比になってますな。