パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Webの完全インデックス化を目指すP2P技術」記事へのコメント

  • by rohi (5663) on 2001年11月14日 1時18分 (#38038)
    個人PCから各地のWebサーバを訪問してインデックス構築するよか、各地のWebサーバ自身に、保持するコンテンツのインデックス構築の義務を負わせるほうがいいんじゃないか、と思った。
    各Webサーバが保持するコンテンツのインデックスとダイジェストを、検索サーバ間で流通させとけばいいんじゃないのかな。

    決めなきゃならないもの…
      ・インデックス+ダイジェストの流通フォーマット
      ・検索サーバとWebサーバのやりとり方法

    まずは、Apacheのモジュールとしてnamazuを組み入れるところから実装をはじめるとか。

    検索サーバ=Webサーバにして、分散検索サービスを構築すべきかな。いや、検索サーバーは、世界中のWebサーバーから送られてくるインデックス+ダイジェストをまとめあげて、ユーザからの検索要求にこたえるべきか。
    • やっぱり、新しいProtocolを作るとか、
      SOAPとやらで投げるとか、するんでしょうか?

      ん。DNSならぬDomainNaiyouServiceとか?
      親コメント
    • 分散検索サーバにすりゃいいじゃん、
      それならロボットで無駄にカウンタ回らないしー。
      とか一瞬お気楽に思ったんですけど、
      そうするとgoogleみたいな効率の良い検索って
      なかなか出来ないんじゃないでしょうか。

      するとやっぱり検索サーバはwebサーバからのインデクスを
      得る形の方が良いようだけど、それでも効率のよい検索が
      可能な仕組を考えねばいけませんよねぇ。
      しかも後にそれより良い検索方法が考案された場合には、
      それを実現するには検索サーバを改良するだけじゃなくて
      世界中のWebサーバを書き換えなきゃならんのでしょうか。

      ちょっと気が重いかも。
      親コメント
      • Webサーバの検索エンジンは、アルゴリズムごと外部から流し込めるようなのにすればいいんだね。
        インデックス流通に関しては、検索方法に影響されないほど普遍的なプロトコルを用意するってのが第1段階。
        第2世代は、インデックスから情報を検索するアルゴリズムも、インデックスとともに流通するというのでいいんじゃないかな。
        親コメント

ソースを見ろ -- ある4桁UID

処理中...