パスワードを忘れた? アカウント作成
421662 journal

kinnekoの日記: 検索したい MS-Office 文書量 4

日記 by kinneko

検索の必要な MS-Office 文書はどれだけ持っている?
共有の必要なものは、そのうちどれくらい?
検索エンジンは 3000 文書とかで 50 万円もするけど、そのくらい
のデータは皆普通に持っているのではないか。
わたしはこの手のデータをあまり持ってないので、営業マンのを
調べてもらったら 4000 以上あった。
だとすると、その価格はとてもナンセンスなものだ。
検索が必要となるのは、持っている文書のうちどのくらいなのだろ
う。
Inktomi や goo と比べると Mitake が一番コストパフォーマンスい
いかなぁ...

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2002年05月13日 15時54分 (#92589)

    namazuのword, excel用検索プラグインで、結構ステキに使える気がしますですよ。
    ゲイツOS用もあります。
    http://www.namazu.org/windows/index.html.ja [namazu.org]

    nekoie(会社員)
    • Namazu は当然知っていて、自分でも会社のサイトが全文検索でき
      ないのが仕事に差し支えたので、だいぶ前から使っているます。
      今は、会社のサイトのほうが採用しているけどね(^^;。でも、リン
      ク切れも収容しているわたしのインデックスのほうが優秀(^^;。

      もちろん、オープンソース系フィルタと併用する事ができるのもわ
      かっているのですが...
      オープンなフィルタはプロパティ検索まで対応しているのかな。
      デ変研の商用フィルタを使っている例もあるようですね。
      でも、パーソナルライセンスなくなってから、高い感じだし。

      最近、商用検索製品のベースに Namazu を採用した一社が音をあげ
      かかっていてセカンドソースを探していると耳にしました。

      やっぱ、継続的にメンテしてゆくということや、辞書系の弱さなん
      かが実運用する上では問題になると思うのです。次に来るのは、イ
      ンデックス化の速度。kakasi や chasen ではいまひとつではない
      かと。さらに XML 文書を検索できるかという点もこれから重要。
      親コメント
      • うーん、なるほどです。
        4000件ぐらいなら、namazuで十分じゃないかな、と思ったのですが、既に利用されていたのですね。。
        (word文書から検索→外部には大っぴらに公開しない文書→検索速度はそんなに重要でない、みたいに勝手に思ってしまったので。)

        確かに、辞書系の弱さはちょっと問題ですねnamazu(当時はあまりchasenが安定していない頃だった気がするので、品質には目をつぶって、kakasiを使用してましたが)。とはいえ、日本語の場合は、どうしても単語分割の品質は限界があるような気もしますけど。

        そういえば、googleのはどうなのでしょう?データの重み付けに優れていそうなイメージがありますが……

        親コメント
typodupeerror

犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー

読み込み中...