パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Mozilla1.3bリリース、変更点山盛り」記事へのコメント

  • 私は数週間前からジャンクメールコントロールという新機能を試していますが、これは素晴らしい確率でスパムを検出してくれます。ベイジアンフィルタという統計的手法を使っているそうです。「スパムへの対策」 [dreamhost.com]という論文で詳しく解説されています。

    • それって日本語のジャンクメールもOKですか?
      • せっかく参考になる論文へのリンクが張ってあるのだから読むべし。あなたの求めている答えもそこにある。
        • by bero (5057) on 2003年02月12日 8時12分 (#256727) 日記
          論文では「メール中の単語からspam確率を求める方法」についてかかれているが、mozillaが日本語対応かどうか、つまりスペース区切りでない言語から単語を切り出せるかどうか、の直接的な答えにはなってない。
          (単語切り出しについては、論文筆者は続編で改良を試みてるが、3-gramとか、日本語の2-gramの実験もある。)

          でmozillaの実装はどうか? と見てみると、一応対応している。

          まずスペースや記号で区切った後、全部数字なら無視、全部ASCIIならそのまま単語とする。それ以外はi18nルーチンに飛び、「カタカナのかたまり」「ひらがなのかたまり」「半角カナのかたまり」「それ以外のかたまり(英数含む)」に分けてる。
          親コメント

ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ

処理中...