パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

namazu 2.0.15、1年ぶりのリリース」記事へのコメント

  • kakasiをupdateしてほしいなぁ。 わかち書きの分解精度が悪くてちゃんと検索されないことが多いと感じているので。
    • そのためのMeCab (スコア:4, 参考になる)

      by KENN (3839) on 2006年01月31日 23時28分 (#874541) ホームページ 日記

      chasenには前から対応してましたけど、今回のMeCab対応により、namazu本体とkakasiの両方をメンテナンスするのではなく、特定の形態素解析器への依存を排除する方針を選択した、という意図がより鮮明になったと思います。

      参考:ChasenとKakasiとMeCabの形態素解析・わかち書きの比較 [nomadscafe.jp]

      まぁ、形態素解析を必要としないN-gram方式の全文検索もいろいろ出てきたので、kakasiのアップデートを期待するよりも、kakasiを使わない方法を模索した方が吉かと。

      #「自分でkakasiをhackする」という選択肢もありますが。

      親コメント
      • by oota (23730) on 2006年02月01日 22時58分 (#875197)

        早速、和布蕪 [chasen.org]いれて、Namazuをupdateしてみました。

        できたNMZ.wを見てみると、わかち書きの精度は確かに良くなっていますね。速度もあがってkakasi [namazu.org]よりは良いものの、namazu.cgiの分解とうまく合わない点はあまり変わらない。namazu.cgiの形態素分析はいまだに独自のままなのだろうか。

        perl moduleがCPANにないのもちょっと。自分でMakeするのがたいした手間というわけではないけれど。

        親コメント

「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」

処理中...