パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

スパムフィルターを高速化するには?」記事へのコメント

  • by Anonymous Coward on 2013年09月01日 17時07分 (#2451937)

    spamassassinのようなフィルタプログラムでスパムにマークして、それのマークをprocmailで振り分ければいいだけでは?
    たまに誤判定もするけど、それは学習させればいいし。定期的に自動学習するようにcronでも設定しておけば、誤判定したメールをspamフォルダに移すだけでよいし。

    まず、自分でスパムのどの部分のパターンを取り出してprocmailのレシピにするのかが手間だし、そのパターンもランダムに変わらないところを選ばないと行けないし、あまり一般化すると必要なメールも引っかかるしで、面倒ばかりでいいことあるとは思えないけど。それから、procmailのレシピが肥大化して15秒とか、いったい何件ルールを書いているのだか。ちょっと古めのCPUでも、1000件の処理なんて一瞬でしょう?

    自分でルールを厳密に決めて、完璧にスパムをはじきたいなら、もうルールをひたすら書き続ければいいと思う。

    • by Anonymous Coward

      たまにある誤判定が業務用には厳しい。

      • たまに迷惑メールフォルダをチェックする必要はあるだろうね。
        どんな方法でも誤検出をゼロにすることはできない。従って、どんな方法であろうと、たまには迷惑メールフォルダをチェックする必要はある。例外は、本人チェックのみ。
        すべて本人チェックする業務負荷と、たまに迷惑メールフォルダをチェックする業務負荷のどちらが大きいかを勘案して決めなよ。

        親コメント
        • 正直、誤判定はゼロ、とは断言できません。
          SA標準の状態では、日本語メイルに対しては結構誤判定が多いです。
          自前でuser_prefsを11年ほどメンテしてますが、誤判定ゼロか、と言われるとちょっと自信がない。
          7〜8年位前に一回だけ、spamディレクトリにhamが紛れ込んだことがあります。
          それ以来、かなり安全方向にルールを作っています。

          親コメント
          • SpamAssassinにご公開いただいているuser_prefsを適用して2年ほど使っていますが、false positiveは一度も起きていません。(negativeのほうはボチボチ…) ほかのスパム対策ソフトウェアと比べても圧倒的に優秀です。この場を借りてお礼を申し上げます。ありがとうございます。
            親コメント
          • 私は通称「TLEC の user_prefs」 [spamassassin.jp]を利用しています。あとは、誤判定されないように、普段メールをやりとりする相手はホワイトリストを追加する感じで、だいたい問題ないですね。

            あとは、入り口でS25R+tarpitting [srad.jp]を実施。
            SMTP接続がかかったときに、接続元のIPアドレスを見て「動的IPアドレスっぽい逆引き名のホスト」「逆引き出来ないホスト」からの接続の時は65秒待つ、というだけの処理なんですが、それだけで面白いようにメール受信数が減ります。

            親コメント
          • ああ、まだ拙作user_prefs使って下さってる方がいらっしゃる。
            ありがとうございます。m(__)m
            最近更新が滞り気味ですいません。
            半ばライフワーク化してますが、メイルがなくなるか、spamがなくなるか、SAがなくなるか、自分がキーボード叩けなくなるまで更新し続ける所存です。

            親コメント
          • by Anonymous Coward

            SA標準の状態では、日本語メイルに対しては結構誤判定が多いです。

            これ、よく聞くんだけど、個人的な実感とは合わないんだよなぁ。
            うちの場合は、ほぼ確実に的確に判定してくれる。

            spam/hamがきわどい領域で生活しているユーザーが多いのだろうか。

      • まずは、あんたのいう「業務用」を定義しろ。
        話はそれからだ。

        親コメント
        • by Anonymous Coward

          どっちかって言うと、「たまに」の定義をまず知りたい。
          仕事用だろうが私用だろうが、誤判定が致命的なミスにつながる可能性はある。

      • by Anonymous Coward

        誤判定をスパムフォルダに移動させる手間と、すり抜けてきたスパムの内容から、ランダムに変わりそうになく特徴的な部分を分析してprocmailのレシピに書き込むのと、どちらが手間でしょうか?
        大人数を抱える業務システムを運用したことがないので、ストーリーの方法と比較してどれくらい厳し野かがちょっと見当つきません。

        • 私は、SpamAssassinを使い始める前は、procmailで頑張っていた時期がありました。
          はっきり言って、破綻します。
          procmailのレシピは書きにくく、記述できる内容も貧弱で、お話になりません。
          procmailでレシピをゴリゴリ書く位なら、SAのルールをいじる方が遥かに楽です。

          spamフィルタの精度にもよりますが、一般的に、誤判定はfalse negativeの方が処理は楽です。
          false positiveが面倒。

          親コメント
      • by Anonymous Coward

        この人間様は誤判定をすることなどないという妄信はいったいどこから来るのだろうか。
        飛行機だってオートパイロットは信用できないから最初から最後まで人間が張り付いて操作すべきだよね。

        • by Anonymous Coward

          ん?飛行機(少なくともジェット推進およびターボプロップ推進旅客機)は四六時中人間張り付き操作になってるだろ?

          • by Anonymous Coward

            それって事故率を下げるため?
            単に人間の方が安いからじゃないの?

            • by Anonymous Coward

              いまどきオートパイロットがないジェット機なんて飛んでるの?

              • by Anonymous Coward

                普通オートパイロットのついたジェット機には常に人間が張り付いて飛行しているわけですが。

              • by Anonymous Coward

                えーっと…
                「四六時中人間張り付き操作になってるだろ?」に対する反論が
                「それって事故率を下げるため?単に人間の方が安いからじゃないの?」でその反論が
                「いまどきオートパイロットがないジェット機なんて飛んでるの?」でその反論が
                「普通オートパイロットのついたジェット機には常に人間が張り付いて飛行しているわけですが。」…?

                「の方が安い」ってどういう意味の主張だったんですかね?

      • by Anonymous Coward

        内容によるけど業務用には厳しいね。納期変更とかフィルタリングされたら泣くに泣けない。
        「フィルタリングされてました」なんて言ったら信用がた落ちだし。

        • by Anonymous Coward

          自分で設定したprocmailのレシピでも同じ事が起こる可能性もあるよね?
          ホワイトリスト作っておけばいいのか?

          • by Anonymous Coward

            どう判定するか予測できるか出来ないかの違いかな。

            • by Anonymous Coward

              自分で設定してても予想外の誤爆があるからなあ。

              • by Anonymous Coward

                それはわかるけどね。

    • by Anonymous Coward

      spamassassinつかっていますが、各種SPAM発信源IPv4アドレスを掲載しているDNSへの照会がけっこう時間がかかりますね。
      うちは30秒くらいかかっています。
      並列化してもこの部分は高速化できません。

      ほかに有用な方法としては、http://www.spamarrest.com/ [spamarrest.com]なんかがあるとおもいます。
      メールの送信者はメールをおくった後、自動返信メールでこのサイトに誘導され、CAPTCHAをしなければならず、通るとメールが本来の宛先に届くというものです。
      送信者に手間をかけさせるのがよいのかどうかは議論のわかれるところでしょうが...

弘法筆を選ばず、アレゲはキーボードを選ぶ -- アレゲ研究家

処理中...