パスワードを忘れた? アカウント作成
4460 story

/.jpも対象の即時に検索 48

ストーリー by wakatono
がんばれ和製サーチエンジン 部門より

kona 曰く、 "NTTのニュースリリースによると, NTT は gooを運営するNTT-Xと共同で, 「8000万ページと言われる日本国内の全Webページをカバーしつつ、最短で15分前にWebサーバに掲載された情報の検索を可能にし、日々刻々と変化する各種ニュースは勿論のこと、新製品情報やスポーツ速報、最新のイベント情報などあらゆる情報を、どこよりも早く検索することを可能」とした 最新Web検索実験サービスを実施するとのこと. 試してみると /.jp の新し目のコメントもHitして, 人によっては使い出がありそうだが, ここのところGoogleにずいぶんと水をあけられた感の有るgooの復活の足がかりとなり得るだろうか?"

変化にいち早く対応するのは重要だ。それを実現した上でぜひ重み付けなどにもチャレンジしてほしい。Googleの使い勝手の良いところは、検索結果の上位にくるものはかなりの確度で役立つものであるというところだ。願わくばGooデビュー当時のインパクトをもう一度。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 巡回間隔 (スコア:4, 参考になる)

    by miyagawa (2470) on 2002年12月05日 23時56分 (#212816)
    User-Agent は mogimogi/1.0 ですね。

    自分とこ [bulknews.net]ですがだいたい、15分間隔できてます。

    [05/Dec/2002:22:54:29 +0900]
    [05/Dec/2002:23:15:18 +0900]
    [05/Dec/2002:23:31:50 +0900]
    [05/Dec/2002:23:53:00 +0900]

    • Re:巡回間隔 (スコア:2, 参考になる)

      by jby (5170) on 2002年12月06日 6時12分 (#212909)
      ここ [c-moon.jp]にこのbotのことが書いてありますが、
      以前はUser-AgentをIEに偽装してrobots.txtも読まなかったみたいですね。
      今はrobots.txtを読んでいるみたいです。

      gooのbotって前々からあまり評判がよろしくない気がする…
      親コメント
    • Re:巡回間隔 (スコア:2, 参考になる)

      by bairo (9940) on 2002年12月06日 11時34分 (#212994)
      ウチのケースでは、トップページからリンクを辿るのに
      わざわざ一分間隔空けてました。

      [03/Dec/2002:19:04:01 +0900] "GET / HTTP/1.1"
      [03/Dec/2002:19:05:01 +0900] "GET /start.html HTTP/1.1"
      [03/Dec/2002:19:06:02 +0900] "GET /menu.html HTTP/1.1"

      意外と(?)細かいところまで気を使ってるんですね。
      親コメント
    • ああ、コイツがそうなんですか。最近、web serverのlogに頻繁に足跡を残しているので、てっきり、新手のWormかと思いました。
      --
      ゆーへん
      親コメント
    • by densuke (113) on 2002年12月06日 11時07分 (#212976) 日記
      どっからだろう、定期的にたたくボットだなぁ、とブロックさせてましたがこれでしたか。

      だからといって解除する気は毛頭なし
      --
      -- やさいはけんこうにいちば〜ん!
      親コメント
      • by patagon (1453) on 2002年12月06日 12時43分 (#213028) 日記
        > -- Slashdot Japanサイドバー http://fuga.jp/~densuke/sd.html
        これいいですね。サイドバー対応のブラウザで使うものですよね。
        実はこの「Slashdot Japanサイドバー 」の存在は、以前から知ってまして、
        でんすけさんに直接メールを出そうかと思いましたが、お忙しいでしょうから
        やめました。

        tDiaryのプラグインになったらいいなと(^^;
        くれくれ君ですみません。
        Rubyがわかるなら私も作ろうかなと思うのですが。
        でんすけさんは既にご存知でしょうが…
        http://www.tdiary.org/ [tdiary.org]
        http://www.tdiary.net/ [tdiary.net]
        どさくさまぎれの宣伝(^^; 太陽雑音 [tdiary.net]
        親コメント
    • by Anonymous Coward
      凶悪なクローラー「moget」の再来ですか?
    • by Anonymous Coward
      自分とこは見にも来てくれません。robots.txtはおいてないのに。

      恥ずかしいのでAC
  • by Anonymous Coward on 2002年12月06日 10時26分 (#212956)
    新しいのがすぐ登録されるのもいいですが、古いのもすぐに消えて欲しいと思います。

    大学の学生が作成したページだと、卒業したらすぐに削除されてしまうことが
    多いらしくてNot Foundが多いです。
    フリーホームページサービスも、すぐ無効になってしまうらしくてNotFoundが多いですね。

    Not FoundになってもキャッシュがあるからGoogleに走っちゃうんですよね。
  • by Linkey (4575) on 2002年12月05日 23時05分 (#212779) ホームページ 日記
    Solaris+Oracle→NT+SQLServerに変わった?頃に
    検索制度と安定性が非常に悪くなってしまったと思う。

    その頃に使い物にならないと思って見捨ててから
    まったく使った事がないです。
    これでgoogleからの復権なるのか?
    • by abilitei (1889) on 2002年12月06日 0時38分 (#212843)
      自分も同じころに使うのをやめましたね。他の検索サイトで
      見つかるものが全然みつからなくなったし。
      あと、クッキーを大量に要求されるのも嫌になった理由でした。

      さて、どうなるのか楽しみです。
      親コメント
    • by Anonymous Coward
      RHL + MySQLで構築されているそうです。

      # あまりにナニなのでAC
  • ここ最近のところ自分の日記 (11/29 [srad.jp]、12/04 [srad.jp]、12/04 [srad.jp]) で調べているのですが、
    Google も /. へは一日一回クロールに来ているようです。
    なのでキーワードをうまく選べば Google でもこれに近いことが出来ます。
    まぁ NTT-X 並みの15分とかは無理ですが。
  • by Anonymous Coward on 2002年12月06日 5時11分 (#212904)
    前の翻訳実験もサービスに適用されないし、実験終わったらいつもなくなるんだけどなんでだろう。
  • by Anonymous Coward on 2002年12月05日 22時46分 (#212774)
    ここのスレのタイトル入れたら見事に引っかかりました。 しかし、新情報と言ってもやはりニュースは一つの所へまとめておくべきだと実感しましたね。 そのニュースの単語を見つけるのが困難だし、せっかくの機能が普段はまったく意味がないような気がします。
    • Re:人によっては... (スコア:1, おもしろおかしい)

      by Anonymous Coward on 2002年12月05日 23時20分 (#212788)
      半角文字版で「うp」を追っている人には朗報かも。
      #「うpしますた」とか。
      親コメント
    • 以前(私の日記 [srad.jp])は /. の日記までも「最速ニュース」になっていて楽しかったのですが、
      このサービスになってからは対象外になってしまったようですね。
      他の人の日記からネタ拾いするのに便利だったのですが。
      私にとっても残念ながらあまり意味がなくなってしまいました。
      親コメント
    • s/スレ/ストーリー/

      それとも、本来の意味でのスレ (#212774 から始まるようなもの) のことを言いたかったのでしょうか。

      • by Anonymous Coward on 2002年12月05日 23時57分 (#212818)
        たぶん2ちゃんからやってきた人なんだろうけど、2ちゃんだといわゆる「スレ」の中身は一本鎖で、「スレ」の中にスレッドを作ったりできないですよね。だから2ちゃんで「スレ」と呼ばれているものは「スレ」と呼んでいいんだけど、/. ではストーリーのことを「スレ」と呼ぶと、ストーリーとは別個のものとしてスレッドが存在しているので、それと区別がつかなくなって意思疎通の妨げになります。

        乱暴な例え話になるけど、イヌしかいなくてネコがいない(ネコの存在が知られていない)世界では、イヌのことを別名あるいは通称でネコと呼んでも構わないけど、イヌもネコも存在する世界では、イヌのことをネコと呼ぶと混乱の元になります。ネコと言ったとき、それが本来のネコのことなのか、イヌのことを話しているのか、わからなくなってしまいますから。

        それとも、いっそのこと、「アレ」って呼んでみる?

        親コメント
  • Googleの何がいいって、 (スコア:1, すばらしい洞察)

    by Anonymous Coward on 2002年12月05日 23時18分 (#212787)
    あのトップページのデザインのシンプルさでしょ??

    だからgooにもこの機能だけ抜き出した専用のページを作っていただきたいなと思うんですが。
    • シンプル (スコア:2, 参考になる)

      by otk (8452) on 2002年12月05日 23時33分 (#212798) ホームページ 日記
      >gooにもこの機能だけ抜き出した専用のページを作っていただきたいな

      実験提供中のサイト [infobee.ne.jp]はいたってシンプルですね。好感。
      ただ商用運用となると、広告スペースを作ったり雑多なコンテンツを入れたりしていくことになるんでしょうね。

       #それより私はこのエンジンに対応したツールバーがほしい
      親コメント
      • ツールバーも良いですが、GoogleのようにWebサービスとして他のプログラムからの利用を公開して欲しいですねえ。
        売上をあげなきゃならないという立場からすると難しいのかもしれないけど、Googleが成功したのは何も「検索結果」の優秀さだけではないのだから....。
        親コメント
        • by Anonymous Coward on 2002年12月06日 0時49分 (#212851)
          でも、
           「google が成功したのは Web サービスのインタフェースを
            提供したから」
          ではないと思うよ。
          親コメント
      • Re:シンプル (スコア:1, 参考になる)

        by Anonymous Coward on 2002年12月06日 9時20分 (#212934)
        > #それより私はこのエンジンに対応したツールバーがほしい

        ツールバーってコレの事でしょうか?

        http://stick.goo.ne.jp/

        「検索」ボタンの右にある「最速NEWS」でこの実験に繋がります。
        親コメント
      • by Anonymous Coward
        ツールバーよりサイドバーがほしいと思うのはmozillaメインだからでしょうか。

        まぁ、検索サイトとしてgooを使えばいいだけかもしれませんが日本語パック入れてないと使えないのがちょっと...
    • >だからgooにもこの機能だけ抜き出した専用のページを作っていただきたいなと思うんですが。

      このページに巻き上げたgoo.co.jpを使うのがいいかも
      十六夜
      親コメント
  • 巡回ペース (スコア:1, 興味深い)

    by Anonymous Coward on 2002年12月05日 23時43分 (#212807)
    って事は、15分に1回のペースで全ページ拾われるって事か?
    人によっては迷惑なペースのような。
    #robot.txt更新しなくては。
    • by Anonymous Coward on 2002年12月06日 0時38分 (#212845)
      プル型じゃなくてプッシュ型とでもいうか、コンテンツが更新されたら
      自分のほうからサーチエンジンに知らせてあげる枠組みは作れないものだろうか。

      協力者はサーバにアドインを仕込む。更新したときには
      自動的にサーチエンジンのデータベースに登録してあげる。

      こうすると無駄がない上に提供者の意思で登録したりはずせたりして便利なんだけど。しかも最速。
      親コメント
      • Re:巡回ペース (スコア:2, 参考になる)

        by tyamadajp (10476) on 2002年12月06日 2時05分 (#212881) ホームページ
        そういう subscribe-notify モデルをサポートするための HTTP/1.1 の拡張として HTTPEvents [google.com] とか MONITOR [google.com] 命令が語られていたりします。

        これが入れば今のリンクと同じようにモニタ関係で結ばれたページ群が各所に自己生成して、その中から生まれた巨大群だけサーチエンジンがモニタ、みたいな構造ができそうです。
        親コメント
    • 想像ですが単純に一律 15 分ではなくて、各サイト・ページの更新頻度を記録しておいて、頻繁に更新がかかり、なおかつ他の指標(例えば GoogleRank とか)で要チェックとされる所だけ最短で 15 分毎に巡回、という方式なんではないでしょうか。

      最短間隔でのモニタが必要と判定されるページが 1000 ページもあれば毎秒アクセスがくる勘定になるのでちょっと迷惑かもしれませんが、そういう所はきっとそれなりの規模とアクセスがあるのでOKでしょう。

      # それに一律 15 分間隔では処理をどれだけ細分化しても
      # 圧倒的な流入データ量で自分の方が詰まってしまいそう
      親コメント
    • Re:巡回ペース (スコア:1, 参考になる)

      by Anonymous Coward on 2002年12月06日 2時14分 (#212884)
      ここ [zdnet.co.jp]に結構詳しく載ってますが、
      更新頻度を学習して巡回ペースにメリハリを付けてるっぽいですね。
      1ホストへのアクセス集中についてもそれなりに配慮しているようです。

      Linuxクラスタなんですね。
      親コメント
    • by Anonymous Coward
       #robot.txt更新しなくては。

      robots.txtを変更しないと意味がない罠。

      #あまりにつまらないつっこみなのでAC
      • by Anonymous Coward
        恐ろしいことに、"robot.txt"を読みに来るクローラも実在するのだった。韓国のなんとかってやつだったが...思い出せん。

        とりあえずrobots.txtをrobot.txtにコピーしましたが。
  • by Anonymous Coward on 2002年12月05日 22時18分 (#212755)
    かなり新しいものでも引っかかりますね。
    使い方によってはかなり便利そうです。

    Googleとフツーに勝負しないで、相手のできないことをやる
    というのはいいですね。

    # 選択がたくさんあることはいいことだ
  • by Anonymous Coward on 2002年12月05日 23時07分 (#212780)
    やっぱり名前変わるんだろうか?
  • by Anonymous Coward on 2002年12月06日 5時57分 (#212908)
    で引いて見ると、以外とたくさんヒットする。
    /.Jくらいしか出てない単語と思ったが。

    しかし、よく結果を見ると漢字は1字毎に区切って検索している。

    「XX大学教授 脳神経生理学」
                    -------

    でもひっかかる。
    結果の検証が大変そう。
    • by grove (269) on 2002年12月07日 12時05分 (#213708)
      「授脳」では一件もヒットしないので、一文字ずつ区切っているわけでは
      なさそうです。「脳神経」を「脳 / 神経」と区切っているのでしょう。
      Googleも同様の解析をしていますね。chasenだとどーなんだろう..
      親コメント
  • by Anonymous Coward on 2002年12月06日 17時10分 (#213199)
    なんか大ニュースが流れたら掲示板にガセ情報を書きまくって、
    検索結果の品質を思いっきり劣化させることって可能なんじゃないかと思うんだけど??
  • by Anonymous Coward on 2002年12月06日 23時19分 (#213475)
    が、同時期に重なっているのは、
    この実験のせい?ってのは単なる勘繰りですか?
typodupeerror

普通のやつらの下を行け -- バッドノウハウ専門家

読み込み中...