パスワードを忘れた? アカウント作成
680778 journal

kinnekoの日記: spam な時代 5

日記 by kinneko

8年くらい使っているあるメールアカウントの状況。
4月の着信は1100件強くらい。
そのうち、spam は 43%。500通弱ある。
日本語の spam は、たったの 20 通くらい。
そのほとんどが海外からの英語 spam である。
これはもはや尋常ではない事態ですな。

びっくりするのは、rapiddealsbyemail.com をのぞいて、3 通以上
の同じ差し出し人からのメールはなく(同じ送信リストに重複登録
されていたと思われるものは除く)、同じサブジェクトでのメール
は最大5通のものがあっただけで、ほとんど1、2通しかない事。
ここまでバラバラだと機械的に除去するのも難しいと思われる。
ISP のサーバー側でバルク送信されてくるものは拒否するのが有
効かもしれないが、ML も同じ方法なのでちょっと難しい。

spam の除去はウイルス除去よりビジネスになるかもしれないけど、
ウイルスと違って除去パターンを確定するのは難しそうね。

Conceptbase なエンジンを使って、内容要約した結果、一般的な
セールスであれば捨てるというようなインテリジェント化が必要
でしょうね。just さん、やらないの?

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 「メールの分析」とかいう機能をつけたらどうかしら。
    家計簿みたいですが

    「家族・友人とのやりとり」・・・4%
    「仕事」・・・7%
    「スパム・広告」・・・85%
    「その他」・・・4%

    みたいなものを出力してくれるというもの。
    --

    - Ryuzi Kambe -
  • by snitch (10903) on 2003年05月02日 23時42分 (#308774) 日記
    4月に受信したメール
    約3,200通

    spam
    884通(日本語なもの約10通)
    ウィルス
    10通(全てKLEZ.H)

    改めて数えてみましたが日に30件は届いてます。

    殆どWin32な環境なので秀丸の姉妹品の鶴亀メール使ってますが
    spam用のfilter設定だけで200程度登録してます。
    英語のメールは基本的にはやり取りすることは無いので
    Content-TypeやFrom:のカントリーコードで落とす設定が多いですね。

    設定の(こくごく)一部

    広告
            "Subject:" が "!広告!" を含む または
            "Subject:" が "!広告!" を含む または
            "Subject:" が "!広告!" を含む
            → "SPAM"に移動する
    未承諾広告、未許諾広告、末承諾広告
            "Subject:" が "未承諾広告" を含む または
            "Subject:" が "未承認広告" を含む または
            "Subject:" が "末承諾広告" を含む
            → "SPAM"に移動する
    ADV:
            "Subject:" が "ADV" の単語を含む
            → "SPAM"に移動する
    iso-8859-1,iso-8859-2,ks_c_5601-1987
            "Content-Type:/X-Body-Content-Type:" が "iso-8859-1" を含む または
            "Content-Type:/X-Body-Content-Type:" が "iso-8859-2" を含む または
            "Content-Type:/X-Body-Content-Type:" が "ks_c_5601-1987" を含む
            → "SPAM"に移動する
    Windows-1252、GB2312_CHARSET、multipart/related;
            "Content-Type:/X-Body-Content-Type:" が "Windows-1252" を含む または
            "Content-Type:/X-Body-Content-Type:" が "GB2312_CHARSET" を含む または
            "Content-Type:" が "multipart/related;" を含む
            → "SPAM"に移動する
    Windows-1251、ks_c_5601、multipart/alternative; boundary="=_NextPart
            "Content-Type:/X-Body-Content-Type:" が "Windows-1251" を含む または
            "Content-Type:/X-Body-Content-Type:" が "ks_c_5601" を含む または
            "Content-Type:/X-Body-Content-Type:" が "multipart/alternative; boundary=\"=_NextPart" を含む
            → "SPAM"に移動する
    text/html; charset=US-ASCII
            "Content-Type:" が "text/html;" の単語を含む かつ
            "Content-Type:" が "US-ASCII" の単語を含む
            → "SPAM"に移動する
    default、WC_MAIL、boundaryboundary
            "Content-Type:" が "default" の単語を含む または
            "Content-Type:" が "WC_MAIL" を含む または
            "Content-Type:" が "boundaryboundary" を含む
            → "SPAM"に移動する
    charset="DEFAULT_CHARSET"、windows-1250
            "Content-Type:" が "charset=\"DEFAULT_CHARSET\"" を含む または
            "Content-Type:" が "windows-1250" の単語を含む を
            → "SPAM"に移動する
    unknown-8bit
            "Content-Type:" が "unknown-8bit" を含む
            → "SPAM"に移動する
  • by snitch (10903) on 2003年05月03日 0時10分 (#308794) 日記
    ちょっと機会なので昨年からの分を集計してみました。

    http://srad.jp/journal.pl?op=display&uid=10903&id=124479
typodupeerror

私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike

読み込み中...