パスワードを忘れた? アカウント作成
7959 story

Namazu 2.0.13リリース 64

ストーリー by GetSet
定番もののupdate 部門より

nasuda 曰く、 "Namazu Projectが、日本語全文検索システム「Namazu 2.0.13」をリリースしました。現在、同サイトにてダウンロード可能となっています。実に一年七ヶ月ぶりのリリースとなる同ソフトですが、今回のバージョンアップでは以下の強化が行なわれたとの事です。

  • セキュリティ面の強化
  • 対応文書形式を追加
  • 関連ツールのバーションアップに対応
  • 文書抽出制度の向上
  • バグフィックス/新機能の追加
なお、今回のリリースには含まれていませんが、Win32用Namazuは現在、「Namazu2.0.13 RC3」がメーリングリスト上で公開されています。こちらは上記のバージョンアップに加えて、インストーラーによるインストールが可能になっています。Windowsユーザーで未体験の方は、これを期に是非、おためしを。"(続く…)

"今回のバージョンアップの詳細は、以下のようになっています。

  1. セキュリティ面の強化
    • サーバーへ無理な負荷を与える複雑な正規表現検索への対策
    • バッファオーバーフローの可能性がある箇所を修正
  2. 新機能の追加
    • --check-filesize オプションを追加し、タイムスタンプが同一でもファイルサイズが異なるファイルを更新対象とする機能を追加
  3. 対応文書形式を追加
    • OpenOffice.org (Writer, Calc, Impress, Draw)文書
    • 一太郎 ver.5~13/2004 文書
        (doccatなしで利用できるフィルタを追加)
    • RTF文書
    • Apache キャッシュファイル
    • MP3ファイル
    • PowerPoint スライドショー文書
  4. 関連ツールのバージョンアップに対応
    • xpdf 2.02 以降に対応
    • xpdf 3.00 の動作確認(PDF 1.5)
    • wvWare 0.7.4~1.0.0に対応
    • Microsoft Office 2003 に対応
  5. 文書抽出精度の向上
    • インデックス中のノイズを削減
      • HTML_ATTRIBUTES タグ属性(ALT/SUMMARY/TITLE)の削除機能を追加
      • 文書に混ざる制御コードの削除を徹底
      • e-mail に含まれる base64 コード等を除去
    • HTML 文書でタグの属性(ALT/SUMMARY/TITLE)の重み付けを追加
    • 平仮名のみの単語登録、送り仮名除去処理での不具合を解消
    • Microsoft Office 文書内の半角カナの検索に対応
    • Microsoft Word 文書の複数セクションに対応
    • Adobe PDF 文書のプロパティに空データが設定されている場合に対応
    • Macbinary ファイルを誤認してノイズが混ざる問題に対処
  6. バグフィックス、セキュリティホールの修正
    • 下記の問題をはじめ多数の修正をしました
      • 最大ヒット数の判定を誤るバグ
      • フレーズ検索が誤動作するバグ
      • 正しく強調表示、強調表示禁止ができないバグ
      • HTML 文書でスコア計算を誤ることのあるバグ
"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • Estraier (スコア:3, 参考になる)

    by oltio (3848) on 2004年04月14日 19時59分 (#531856) 日記
    Namazuの検索結果ってわかりにくいよね、という一にはEstraier [sourceforge.net]
    がオススメ。ヒットした検索語周辺の抜粋が標準で表示
    されます。私はこれだけで Namazu から乗り換えました。
    また、インデックスDBの生成・更新が速いのも特徴。
    (ただしそれでも重いものは重いので、更新時のみ DB を
      RAMディスク上に置くなどの工夫はした方が良い)

    フィルタ周りが弱いのは開発参加者の数の少なさから
    来ていると思われますので、興味を持ってくれる人が
    増えるといいな。
    • by Anonymous Coward
      フィルタが少ないと言う事ですが、これ(日本語ですよ) [sourceforge.net]を見る限り Windows上では結構色々な形式に対応してるんですね。

      GW に会社でこっそり試してみよう。
      # ホントは n-gram の奴で無料のがあれば欲しいんだけどと言ってみるテスト
      • by Anonymous Coward
        N-gramならWindows限定だけどこんなのが。
        http://www31.ocn.ne.jp/~h_ishida/KWIC.html

        #完全なフリーじゃないけど
  • (スコア:2, すばらしい洞察)

    by parsley (5772) on 2004年04月14日 17時33分 (#531770) 日記
    すらどJへの導入予定は?
    --
    Copyright (c) 2001-2014 Parsley, All rights reserved.
  • by Anonymous Coward on 2004年04月14日 17時38分 (#531775)
    あんまりNamazu [nikkeibp.co.jp]を使っていないそうです。
  • (スコア:1, 参考になる)

    by Anonymous Coward on 2004年04月14日 18時43分 (#531803)
    官公庁とか図書館だと古いバージョンのまま放置されてたりするんですが、
    その辺への注意喚起ってどうするんでしょうね。
    ところで、修正内容はXSSに関するものがメインでしょうか。
    めんどくさいんでAC。

    #ウチはCygwinで動かしてるんで導入はかなり楽。
    #開発者さんがnamazu使ってないという話聞いて、mitakeにしようかと思ったり。
    • Re:ん (スコア:3, 興味深い)

      by Anonymous Coward on 2004年04月14日 20時26分 (#531874)
      > #開発者さんがnamazu使ってないという話聞いて

      原作者が開発から離れていることってそんなに重要なことなのですか?そのようなオープンソースソフトウェアのプロジェクトは大きな成功を収めているものも含めて腐るほど存在するでしょうに。

      たしかに高林さん御自身はNamazuの開発からは離れてしまいましたが、他にもNamazu Projectのメンバーとして開発に関わってきた人は多数存在します。特に今回のリリースでは2.0.12のリリース後にcommitterになった寺西、臼井両氏が精力的に地道なバグの修正や新規文章フィルタの追加及び改善といった作業を進めてきました。本業を他に抱えているためにアクティブに開発に関わることができる開発者が多くないのが現状なので、両氏がいなければ2.0.13のリリースにこぎつけられなかったかもしれません。

      原作者偏長主義が感じられたのであえてACでツッコミを入れてみました。
      親コメント
      • by Anonymous Coward
        すみません、素で質問ですが、namazuは「原作者が使ってない」のと「開発者が使ってない」のと、どっちなんでしょうか?で、もしも「開発者が使ってない」だった場合は、

        >> そのようなオープンソースソフトウェアのプロジェクトは大き
        • タレコみ子です
          開発者の方は使っている様ですよ、
          MLの方でも頻繁にフォローしてますし。

          #なんか荒れてるなぁ
          --
          ____
          #風邪をひきました、脳が故障しています
          #残念ながら仕様です。
          親コメント
          • by Anonymous Coward
            ふー。それ聞いて安心しました。どーもです。
            やっぱりドッグフードが一番。(え?)

            #犬飼いたいなぁ~~~
          • by Anonymous Coward
            >#なんか荒れてるなぁ

            別スレの元発言(#531781)。管理する側にしてはあまりに手抜きなんで
            「サボりたければ読め」と軽くツッコミ入れてみたけど結果的に不味かったですね。
            相手を選ぶべきだったなぁ‥と反省しております。相手によっては
            多少フラ
      • by Anonymous Coward
        臼井→臼田

        です。お詫びして訂正させていただきます。_| ̄|◯
    • Re:ん (スコア:1, 参考になる)

      by Anonymous Coward on 2004年04月14日 19時03分 (#531821)
      紹介してくれてありがとう。namazuは便利なんだけどフィルタの導入が面倒でこまってました。トライしてみます。 MitakeSearchのリンク [hp.com]
      親コメント
  • by Anonymous Coward on 2004年04月14日 17時55分 (#531781)
    どっちなん?

    欠陥修正だったらすぐにでもアップデートするけど、
    強化なんだったらサボりたい。

    ユーザとしてはそこんとこをまず第一に知りたいんだけど。
    • by Anonymous Coward on 2004年04月14日 18時22分 (#531792)
      書いてあるだろうに。両方だと。
      親コメント
    • バッファーオーバーフローの可能性があると
      書いてあるんだから更新しておけ。

      それはそれとして確かに説明が大雑把過ぎると思う。
      あとChangeLogでは先月21日あたりにbuffer overflow
      の可能性を修正したってあるのに
    • 説明が不足していると言う点について思い当たることを。

      あるオープンソース系開発者に「なんでオープンソース系アプリは仕様書がないのですか」と聞いたところ、「動いたら勝ちだから」(正確じゃないけど、こうととれる発言)を貰いました。要するに、仕様がどうとかこうとか言う前に、コードを先に作ってしまう感じだと思います(これは、僕個人の判断)。

      なので、ある改修項目について、それがどような経緯で修正さ
      • > 要するに、仕様がどうとかこうとか言う前に、
        > コードを先に作ってしまう感じだと思います
        > (これは、僕個人の判断)。

        でもIETFやW3Cにあるような濃厚な仕様書とその集大成は
        オープンソース土壌以外でなかなかお目にかからないです
  • by Anonymous Coward on 2004年04月14日 23時55分 (#531967)
    何かナマズ様にお伺いを立てなければ検索してくれなさげな…
typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...