アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
人生の大半の問題はスルー力で解決する -- スルー力研究専門家
robots.txt (スコア:1)
というか、当のgoogleのページの削除 [google.co.jp]にも書いてあるんですが…。
で、googleはこういうインターフェイスを用意し
Re:robots.txt (スコア:1)
Google の cache も例に出ているだけで,すべてに対応した話ではないです.
著作権者およびその代理人が,すべての検索エンジンへの対処法を理解し,実行しなければならないのでしょうか?
もちろん自分の財産ですから,努力するのは良いことでしょうけど・・・
kero
Re:robots.txt (スコア:0)
Wayback Machine(The Internet Archive) [archive.org]あたりが良い例ですよね。
ここは、robots.txtを無視するのは当たり前として(?)、
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">も
<META NAME="ROBOTS" CONTENT="NOARCHIVE">も
全部綺麗に無視して"Archive"してくれています。
公開している以上仕方ないと考えられれば良いんだけど、
やはり残っていて欲しくないものもあったりして、
こういうのの存在も善し悪しだなと思うことも…
そうかと思えば、以前/.-Jでも
Re:robots.txt (スコア:0)
<META>タグはわかりませんが。
参考までに・・、
http://web.archive.org/collections/web/faqs.html#exclusions [archive.org]
# robots.txt を robot.txt と間違っている人かなりいそう。
てか、自分がそうだった。
Re:robots.txt (スコア:1)
2,3ヶ月前は、Cache/Archive抑制用のMETAタグを含んだページが
当たり前のようにarchiveされていて閉口ものだったのですが、
先ほど検索したら、引っかからなくなっていました。
昔からのURLである、http://web.archive.orgにアクセスすると、
www.archive.orgにリダイレクトされるように変更された事もあり
なんらかの変更が行われたみたいですね。ポリシーとかも含め。