アカウント名:
パスワード:
122.152.128.48 - - [22/Mar/2007:17:06:20 +0900] "GET / HTTP/1.1" 200 12769 "-" "Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"122.152.128.48 - - [22/Mar/2007:18:06:11 +0900] "GET / HTTP/1.1" 200 12769 "-" "Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"122.152.128.48 - - [22/Mar/2007:19:05:34 +0900] "GET / HTTP/1.1" 200 12769 "-" "Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"122.152.128.48 - - [22/Mar/2007:20:05:51 +0900] "GET / HTTP/1.1" 200 12769 "-" "Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"
User-Agent: baiduspiderDisallow: /
--- :# Baiduspider# Chinese bad-behavior crawlerDeny from 60.28.*.* : :SetEnvIf User-Agent "[Bb][Aa][Ii][Dd][Uu][Ss][Pp][Ii][Dd][Ee][Rr]" CrawlerAgentSetEnvIf User-Agent "http:¥/¥/www¥.baidu¥.com¥/" CrawlerAgent : :<Directory "/usr/local/www/***/data"> AllowOverride .... Options .... Order deny,allow Deny from env=CrawlerAgent</Directory>---
122.152.128.47 - - [17/Mar/2007:13:24:49 +0900] "GET /security/ HTTP/1.1" 200 30806 "-" "Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt)"
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家
botの方針変えたらしい (スコア:4, 参考になる)
……と思ったら、いつの間にか方針 [baidu.jp]変えとったんだね。
#とはいえ、一度染み付いた悪印象は拭いがたいものだが。
Re:botの方針変えたらしい (スコア:3, おもしろおかしい)
「日本の習慣にあわせて『お百度参り』をさせていたが、願いがかなわなかったので取り止めた」
ということでよろしい?
Re:botの方針変えたらしい (スコア:2, 興味深い)
謝罪まで掲載してるのは好感持てるね。
でも、やっぱ一度染み付いた悪印象は私もなかなか拭えません。
htaccessの設定を変える気は当分無いな
Re:botの方針変えたらしい (スコア:3, 興味深い)
いや、まったく。
403を返しているのに以前収集したリストに従って数アクセス/秒 [homeunix.net]なんてされたら、いい感情は持てないです。
>htaccessの設定を変える気は当分無いな
同様に、robots.txtを変える気にはなれません。
…が、
あれれ?なんで?…と思ったら
となっていました。
心優しいgooglebotやmsnbotは、"User-Agent: *"を、仕方ないなぁ"User-agent: *"なんでしょ?、と大目に見ていたようです。
1時間おきに/を見に来るようなロボットはどうよ?と思うので、robotx.txtを訂正して、改めてbaiduspiderにはお引き取り願うことにしました。
Re:botの方針変えたらしい (スコア:1)
当時相当に頭にきていたと思われます。 今は....やっぱり開ける気はしません。
今時衛星破壊実験やってしまうような国のサービスに、協力する義務も義理も人情も無い訳で。
#中国で政府と無関係でインターネットサービスできると思えますか?
--- de FTNS.
Re:botの方針変えたらしい (スコア:1, 興味深い)
baiduの横暴に腹を立てた多くの人は遮断してエラーすら返さなかった。
サイトがエラーを返さないとtimeoutまで待機しなければならない。
そういうサイトが増えすぎるとbotの運用に支障が出るようになる。
そこで迂回するほどbaiduのbotは賢くない(笑
時間帯的にアクセスピークを避けるのは、反省したからではなく日本語サイトがオープンしたから。
要するにbaiduとしてはアクセスピーク時はリソースをbotに回すより検索利用者に回したい。
もちろん各サイトの都合を考慮したからではない。
ここ半年ほど狂ったようにbaiduが増えたのが日本語サイトのオープンに合わせたやっつけ仕事。
一通り漁ったので、後は更新とるだけなのでそんなにbotをまわさなくて良い。
やっちまえば勝ち的な考えをしているところとは付き合いきれない。
Re:botの方針変えたらしい (スコア:0)
ネット上のいろんなサービスが該当するんですが
Re:botの方針変えたらしい (スコア:1)
ウチでは.htaccessで真っ向拒否してるんですが、何の気なしにドメインで検索したら見事に引っかかっていましたよ。
それもつい5日前のキャッシュがしっかりと残っていました。
あわててログをひっくり返したらこんなアクセスがでてきましたよ。 …UA詐称してますかそうですか。
しかもrobots.txtの「User-agent: baiduspider」を無視していたり、METAタグのNOARCHIVEまで無視していたり…。
またタダでさえ馬鹿でかい.htaccessがまたでかくなるのか…。
Re:botの方針変えたらしい (スコア:0)
baiduspiderになったことを思い出しました。。。。
Re:botの方針変えたらしい (スコア:0)
無限に深い URL に落ちながら、大量アクセスをかけてくれた。
サーバの CPU 負荷が高くなり、最初はクラックされたと勘違いして
すごく焦った。すでにパケットフィルタでアクセスを禁止してます。
他の方、同様、パケットフィルタを戻すなんでないだろう。
# MP3 データ検索なんて、節操の無いサービスがまかり通る所は
# 相手にできん。
## といったら、YouTube のような節操の無いサービスがまかり通る Google は.....