kamuy 曰く、 "Impress INTERNET Watch から。使いようによっては、いわゆる「マスメディア」なぞよりよっぽど有用な情報を得られるネット上の掲示板(いわゆるBBS)ですが、国内の有名どころの掲示板を横断的に検索するサービスが発表となりました。その名も「BBSサーチ」。提供元は Naver Japan 、先月よりベータ公開していたがコレを正式オープンしたもの。
/.Jか対象になっていないのが少々気にならんでもないのですが、同様なサービスって、他にありましたら教えてくだされ。"
Google は的確な関連性の高い検索結果を表示できるものの、新鮮な情報は検索できない - これが弱点でもありました。
(snip)
Google も2002年4月頃より対策を始めました。
(snip)
毎日更新されるニュース系サイト(例えば asahi.com や ascii24、NIKKEI NET 等)が提供している記事です。そこで Google はウェブサイト全体のインデックスを生成する為の定期クロールとは別にこれらのサイトを集中して巡回する
(snip)
フレッシュクロール (スコア:2, 参考になる)
Googleならば/.Jも毎日更新の検索サービス対象になっています。
以前のストーリー [srad.jp]のgooの最速ニュースサーチもいろんな掲示板をこまめにクロールしていますね。
検索対象を掲示板に限定する必然性がいまいちよくわからないです。
「韓国ウェブ」っていうのがちょっと目新しい感じがしますが。
しかし私が試すと2ちゃんねるとYahoo!ばかりヒットする…。そんなものなのかな。
スラドの検索窓… (スコア:2, 興味深い)
"キーワード site:slashdot.jp"
とやらなければいけないのはなんかオカシイ。スラドの記事検索はどうなっているのだ?
仮に /.J が検索対象になったとして、 (スコア:1)
Re:仮に /.J が検索対象になったとして、 (スコア:1, 参考になる)
サーチエンジンのページ検索の仕組みにもよりますが、リンクが張られているページを全て検索する仕掛けだとしたら閾値は「全てのものが対象になりうる」でしょう。
"n 個のコメントが現在のしきい値以下です。" というリンクがありますし。
さすがにフォームポスト(FORMタグ)までエミュレーションして検索する仕組みではない(たぶん)ので、"n 個のコメントが~" のリンクが外されればデフォルトの閾値でページが検索されるはずだと思います(推測)。
はやい! (スコア:1)
Re:はやい! (スコア:1)
すなわち定期的にトピックのチェックをしているから
自動的にリンクされるのは当然。
そういうことではないのかな。
ですね。 (スコア:1)
実は、「gooの新検索ではまだだった」ということも書こうとして
忘れていた事に今気づきました(;_;)
#さすがに、現在ではリンクされておりました。
Re:ですね。 (スコア:0)
毎時30分ですよ。
某所の収益モデルを (スコア:0)
最近da(どこまで書いていいのか掴めてないので以下略&AC)
横断サーチつながり (スコア:0)
便利。
Re:オークション検索つながり (スコア:0)
便利
これって2chも入ってますね。 (スコア:0)
Re:これって2chも入ってますね。 (スコア:1)
なぜ「不当な」アクセス負担増になるんですか?
Re:これって2chも入ってますね。 (スコア:0)
ると、サーバの転送量が増えて迷惑だみたいな話を、以前に管理
者がしていたような…
企業が営利でやってる掲示板監視システムみたいなのについてだ
ったと思うけど…
…って、naverもやってるのね。
http://e-b
絨毯爆撃… (スコア:2, 参考になる)
普通のHTML文書へのアクセスでさえ、サーバや帯域にかなりの負荷を掛けるのに、その頻度が上がると思うとぞっとします。
で、これで検索システムがまともに使えるものでなければ、ただのネットワーク資源を潰すだけの迷惑システムになってしまいますね;(
やるからにはしっかりやって欲しいです。
# robots.txt読まない(読んでも無視)するから、持って行かれたくない(動的だから溜め込まれても困る)ところまで持って行くし。そんな私はmod_rewriteでNaverRobotからのアクセスを全てgoneにしてます。
Re:絨毯爆撃… (スコア:0)
ウチなんかルータで蹴飛ばしてます :-)
Re:これって2chも入ってますね。 (スコア:1)
それこそ訴訟か、訴訟起こす前に2chが潰れるか・・・
試しに過去ログ送りされてるスレのタイトルで検索してみましたが、現行スレすらヒットしませんでした(苦笑
Re:これって2chも入ってますね。 (スコア:1)
> 2ちゃんねるのデータの利用に関して、原則的に自由ですが、
> 2ちゃんねるのデータ自体を利用して対価を取る行為はご遠慮下さい。
と書いてありますよね。微妙ですけど。
「2chの過去記事が検索できる」ことは、データそのものではなく
一段階メタなレベルだし、googleとやってることは変わらないわけで、
許可はなくても別に大丈夫じゃないかと思います。
というかこれがダメなら、世の検索エンジンはどうなるのかと。
不当(?)なアクセス増って言っても、「2chがいまさら」感もあるし。
Re:これって2chも入ってますね。 (スコア:0)
やるとしたら「(刑事)告訴」ではなくて「民事訴訟」でしょう。根拠はアクセス数の増大によって回線費用の負担が増え損害が発生したということで。
刑事告訴するなら、故意に発生させた大量のアクセス要求によってサーバが落ちた(威力業務妨害)とかのよ
Re:これって2chも入ってますね。 (スコア:0)
> 66 名前:夜勤 ★ 投稿日:02/12/26 20:36 ID:???
> もし暇だったら、この検索のクラウワーというかロボットさんを
> はじく方法を教えてください。
>
> 暇な時でいいです、
> 116 名前:夜勤 ★ 投稿日:02/12/26 20:48 ID:???
> >>83
> どもです、
>
> User-agent: nabot
> Disallow: /
>
> これで ok っすね、
> 毎日やられたんじゃ かなわ