by
Anonymous Coward
on 2003年06月26日 10時58分
(#345773)
ベイズフィルタであれば bad 側の単語だけでなく good 側の単語も用いた統計によるので, 性差別問題を扱ったページなどは, おそらく「差別」や「地位」「性差」「社会的」「制度」等といった単語によって good 側に引き上げられると思われます.
フィルタの学習は『識者』によるフィルタリング委員会による公開の子^パス収集によっておこない, そのコーパスおよび学習結果の辞書を公開することで, 問題となっているフィルタ基準の不透明性を払拭できるとも思われます.
知識に線引きかよ (スコア:0)
で、本論。このベイジアンフィルタのソフトウェアを使うってことのキモは、各図書館の側で自主的に閾値を設定できるってことでしょ。検閲反対ならば、閾値をうんと下げてしまえばいいわけで
Re:知識に線引きかよ (スコア:0)
確かに、統計に基づくフィルタに完璧はありえないんですが、私が使っているベイジアンスパムフィルタでは、98%くらいのメッセージはスパム確率が0.1以下か0.9以上になります。閾値の設定は、残り2%のグレーゾーンにあるメッセージにしか意味を持ちません。 それに、判定を誤るスパムには、巧みに偽装されたメッセージによってスパム確率0.1になるようなものもあるので、少なくとも私の経験では、フィルタは閾値の設定に関して極めて鈍感であると言えます。
ただ、何でもベ
Re:知識に線引きかよ (スコア:0)
フィルタの学習は『識者』によるフィルタリング委員会による公開の子^パス収集によっておこない, そのコーパスおよび学習結果の辞書を公開することで, 問題となっているフィルタ基準の不透明性を払拭できるとも思われます.
Re:知識に線引きかよ (スコア:0)