パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

検索したい MS-Office 文書量」記事へのコメント

  • by Anonymous Coward

    namazuのword, excel用検索プラグインで、結構ステキに使える気がしますですよ。
    ゲイツOS用もあります。
    http://www.namazu.org/windows/index.html.ja [namazu.org]

    nekoie(会社員)
    • Namazu は当然知っていて、自分でも会社のサイトが全文検索でき
      ないのが仕事に差し支えたので、だいぶ前から使っているます。
      今は、会社のサイトのほうが採用しているけどね(^^;。でも、リン
      ク切れも収容しているわたしのインデックスのほうが優秀(^^;。

      もちろん、オープンソース系フィルタと併用する事ができるのもわ
      かっているのですが...
      オープンなフィルタはプロパティ検索まで対応しているのかな。
      デ変研の商用フィルタを使っている例もあるようですね。
      でも、パーソナルライセンスなくなってから、高い感じだし。

      最近、商用検索製品のベースに Namazu を採用した一社が音をあげ
      かかっていてセカンドソースを探していると耳にしました。

      やっぱ、継続的にメンテしてゆくということや、辞書系の弱さなん
      かが実運用する上では問題になると思うのです。次に来るのは、イ
      ンデックス化の速度。kakasi や chasen ではいまひとつではない
      かと。さらに XML 文書を検索できるかという点もこれから重要。
      親コメント
      • うーん、なるほどです。
        4000件ぐらいなら、namazuで十分じゃないかな、と思ったのですが、既に利用されていたのですね。。
        (word文書から検索→外部には大っぴらに公開しない文書→検索速度はそんなに重要でない、みたいに勝手に思ってしまったので。)

        確かに、辞書系の弱さはちょっと問題ですねnamazu(当時はあまりchasenが安定していない頃だった気がするので、品質には目をつぶって、kakasiを使用してましたが)。とはいえ、日本語の場合は、どうしても単語分割の品質は限界があるような気もしますけど。

        そういえば、googleのはどうなのでしょう?データの重み付けに優れていそうなイメージがありますが……

        親コメント

※ただしPHPを除く -- あるAdmin

処理中...