アカウント名:
パスワード:
最近は速く計算できるようになっていたりしたら 誰か教えてくれるとうれしいなぁ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日々是ハック也 -- あるハードコアバイナリアン
Support Vector Machine (スコア:4, 興味深い)
世間では,ベイズ分類器しか出回ってないようですが,なぜ SVM を使わないのだろう?やってみたけれど思わしくないのか,それともそもそもやってみていないのか。
自分で作ってみようかな。
主流だと思われる Paul Graham の方式に関して言えば feature selection の段階を手を抜かずに行えば,より精度は上がるような気がします。
Re:Support Vector Machine (スコア:1, 興味深い)
最近は速く計算できるようになっていたりしたら 誰か教えてくれるとうれしいなぁ。
Re:Support Vector Machine (スコア:0)
SVM って分散処理できるような計算なんでしょうか? それとも密結合じゃないとつらい?
Re:Support Vector Machine (スコア:0)
Re:Support Vector Machine (スコア:1, 参考になる)
90年代中頃ぐらいに出て来たばかりだから、まだ研究者の方々は現実的な応用まで気がまわらないんじゃないですかね。今頑張ると良いことがあるのかも。
ベイズの方は計算時間の短縮が可能になって、利用にはずみがついたというような話はよく聞きます。計算時間の短縮って一筋縄じゃいかないんですけどね。(^^;
精度だけでなく確率出力も重要 (スコア:1)
ベイズ分類器を使うさいに嬉しい点は、回答を「SPAM確率95%」のような確率値で出力してくれて、その値がおおむね妥当である点です。
普通のSVMでは、SPAMであるか(Yes/No)のような二値的な値しか出力できません。
正答率のような数値を出して両者の性能を比較する場合に、はベイズ分類器の出力をしきい値処理(例えば50%以上か未満か)して同じYes/Noの土俵で計算します。その際には多少SVMが勝るのかもしれません。でも実用上はSPAM率55%とSPAM率99%とではおのずと扱いも異なるべきであって、こうしたSPAMフィルター用には確率値を上手に扱えるベイズ分類器のほうが便利だということではないでしょうか。
# SVMに確率的出力を行わせる研究もなされているようですが、うまく
# いっているかどうかは知りません。
Re:Support Vector Machine (スコア:0)