パスワードを忘れた? アカウント作成
4771 story

横断的BBS検索サービス開始 20

ストーリー by yourCat
新しいスレとの出会い系 部門より

kamuy 曰く、 "Impress INTERNET Watch から。使いようによっては、いわゆる「マスメディア」なぞよりよっぽど有用な情報を得られるネット上の掲示板(いわゆるBBS)ですが、国内の有名どころの掲示板を横断的に検索するサービスが発表となりました。その名も「BBSサーチ」。提供元は Naver Japan 、先月よりベータ公開していたがコレを正式オープンしたもの。
/.Jか対象になっていないのが少々気にならんでもないのですが、同様なサービスって、他にありましたら教えてくだされ。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 定期クロールとフレッシュクロール [seoglobal.com]

    Googleならば/.Jも毎日更新の検索サービス対象になっています。
    以前のストーリー [srad.jp]のgooの最速ニュースサーチもいろんな掲示板をこまめにクロールしていますね。
    検索対象を掲示板に限定する必然性がいまいちよくわからないです。
    「韓国ウェブ」っていうのがちょっと目新しい感じがしますが。
    しかし私が試すと2ちゃんねるとYahoo!ばかりヒットする…。そんなものなのかな。
    Google は的確な関連性の高い検索結果を表示できるものの、新鮮な情報は検索できない - これが弱点でもありました。
    (snip)
    Google も2002年4月頃より対策を始めました。
    (snip)
    毎日更新されるニュース系サイト(例えば asahi.com や ascii24、NIKKEI NET 等)が提供している記事です。そこで Google はウェブサイト全体のインデックスを生成する為の定期クロールとは別にこれらのサイトを集中して巡回する
    (snip)
    • by simon (1336) on 2003年01月21日 15時09分 (#239857)
      っていうか、スラドへ昔自分が投稿した記事を探すのにGoogleで
      "キーワード site:slashdot.jp"
      とやらなければいけないのはなんかオカシイ。スラドの記事検索はどうなっているのだ?
      親コメント
  • コメントのモデレーションの閾値はどう反映されるのでしょう。 -1 以上? それとも +1 以上?
    • by Anonymous Coward on 2003年01月21日 12時57分 (#239765)

      サーチエンジンのページ検索の仕組みにもよりますが、リンクが張られているページを全て検索する仕掛けだとしたら閾値は「全てのものが対象になりうる」でしょう。
      "n 個のコメントが現在のしきい値以下です。" というリンクがありますし。

      さすがにフォームポスト(FORMタグ)までエミュレーションして検索する仕組みではない(たぶん)ので、"n 個のコメントが~" のリンクが外されればデフォルトの閾値でページが検索されるはずだと思います(推測)。

      親コメント
  • by Abendrot (8840) on 2003年01月21日 13時12分 (#239778) 日記
    ここには [bulknews.net]すでにこのトピックがリンクされてたりします。
  • by Anonymous Coward on 2003年01月21日 11時26分 (#239692)
    さくっとバイパスしているような気がしなくもありません。
    最近da(どこまで書いていいのか掴めてないので以下略&AC)
  • by Anonymous Coward on 2003年01月21日 11時32分 (#239698)
  • by Anonymous Coward on 2003年01月21日 12時08分 (#239726)
    ちゃんと許可はとったんでしょうか? 無許可の場合、不当なアクセス負担増により告訴にも持ち込めますけど。
    • >無許可の場合、不当なアクセス負担増により告訴にも持ち込めますけど。

      なぜ「不当な」アクセス負担増になるんですか?
      親コメント
      • 度々にアクセスして、毎回全てのデータをゴソっと持っていかれ
        ると、サーバの転送量が増えて迷惑だみたいな話を、以前に管理
        者がしていたような…

        企業が営利でやってる掲示板監視システムみたいなのについてだ
        ったと思うけど…

        …って、naverもやってるのね。
        http://e-b
        • 絨毯爆撃… (スコア:2, 参考になる)

          by aviancarry (11928) on 2003年01月21日 15時03分 (#239853)
          Naver Japanっていうと、NaverRobotが、一秒間に数回(5回以上?)というハイペースでのクロールで回線の帯域を存分に潰してくれた…という記憶があるのですが、掲示板なんて、巡回しても大丈夫なんでしょうかね…。

          普通のHTML文書へのアクセスでさえ、サーバや帯域にかなりの負荷を掛けるのに、その頻度が上がると思うとぞっとします。

          で、これで検索システムがまともに使えるものでなければ、ただのネットワーク資源を潰すだけの迷惑システムになってしまいますね;(
          やるからにはしっかりやって欲しいです。

          # robots.txt読まない(読んでも無視)するから、持って行かれたくない(動的だから溜め込まれても困る)ところまで持って行くし。そんな私はmod_rewriteでNaverRobotからのアクセスを全てgoneにしてます。
          親コメント
          • by Anonymous Coward
            >そんな私はmod_rewriteでNaverRobotからのアクセスを全てgoneにしてます。

            ウチなんかルータで蹴飛ばしてます :-)

    • 過去ログはさすがに検索対象ではないですよね?
      それこそ訴訟か、訴訟起こす前に2chが潰れるか・・・

      試しに過去ログ送りされてるスレのタイトルで検索してみましたが、現行スレすらヒットしませんでした(苦笑
      親コメント
    • 2chには

      > 2ちゃんねるのデータの利用に関して、原則的に自由ですが、
      > 2ちゃんねるのデータ自体を利用して対価を取る行為はご遠慮下さい。

      と書いてありますよね。微妙ですけど。
      「2chの過去記事が検索できる」ことは、データそのものではなく
      一段階メタなレベルだし、googleとやってることは変わらないわけで、
      許可はなくても別に大丈夫じゃないかと思います。
      というかこれがダメなら、世の検索エンジンはどうなるのかと。

      不当(?)なアクセス増って言っても、「2chがいまさら」感もあるし。
      親コメント
    • やるとしたら「(刑事)告訴」ではなくて「民事訴訟」でしょう。根拠はアクセス数の増大によって回線費用の負担が増え損害が発生したということで。

      刑事告訴するなら、故意に発生させた大量のアクセス要求によってサーバが落ちた(威力業務妨害)とかのよ

    • このスレッド [2ch.net](但しdat落ち中なので見られません)によると、

      > 66 名前:夜勤 ★ 投稿日:02/12/26 20:36 ID:???
      > もし暇だったら、この検索のクラウワーというかロボットさんを
      > はじく方法を教えてください。
      >
      > 暇な時でいいです、

      > 116 名前:夜勤 ★ 投稿日:02/12/26 20:48 ID:???
      > >>83
      > どもです、
      >
      > User-agent: nabot
      > Disallow: /
      >
      > これで ok っすね、
      > 毎日やられたんじゃ かなわ
typodupeerror

アレゲはアレゲを呼ぶ -- ある傍観者

読み込み中...