パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Disallow:/iraq ― ホワイトハウスの robots.txt」記事へのコメント

  • by Anonymous Coward on 2003年10月28日 15時41分 (#422519)
    単にサーバー負荷を減らすためでしょ。
    考えすぎ。
    • Re:そりゃあ (スコア:2, おもしろおかしい)

      ここまで露骨にやってしまったら、こうやってとりあげられて、/. 効果で逆効果に…なんてことまではいくらなんでも考えつかないか(w。

      --
      むらちより/あい/をこめて。
      親コメント
    • Re:そりゃあ (スコア:2, おもしろおかしい)

      by deleted user (9158) on 2003年10月28日 20時33分 (#422735)
      Disallow: /firstlady/images/iraq

      ファーストレディの画像にものすごい負荷が?
      親コメント
    • by Anonymous Coward
      どうしてイラクを選んだの?
      • by Anonymous Coward
        アクセス多そうなところから対策するのは、対策ものの基本かと。

        # 自明なのでAC
        • by UID0930 (18225) on 2003年10月28日 16時14分 (#422539) 日記
          今更そんなにアクセスがあるの?
          親コメント
          • by Anonymous Coward
            おいおい、誰に聞いてるつもりなんだ?そのACさんがwhitehouse.gov関係者だと思ってる?もしくはwhitehouse.govのアクセスログが公開されてると?
            • by UID0930 (18225) on 2003年10月28日 17時21分 (#422600) 日記
              んなこたーない。
              でもアクセスログが公開されててもおかしくはない。
              税金によって運営されているサーバに対してどういうアクセスがあるかという情報は保管してあるべき。
              情報開示を求めれば国民も見れるかもしれないが、IPやリモートホスト名が個人情報と判断されたら見られないのかな。
              親コメント
            • by Anonymous Coward
              どうしてwhitehouse.govのアクセスログが公開されているわけでもwhitehouse.gov関係者でもないのにアクセス多そうなところが自明だと言い切っているの?
        • ワンダフル自明 (スコア:1, 参考になる)

          by Anonymous Coward on 2003年10月28日 17時37分 (#422614)
          whitehouse.gov/robots.txtについて。
          WayBackMachineに残っている限り [archive.org]でもっとも古いのは2001年4月 [archive.org]で、Disallow:されているのは/cgi-binのみ。同年9月までそのまま。

          2001年9月以降、Disallow:(存在するディレクトリ)/textが追加される [archive.org]。/text以下は画像やレイアウト以外親と同内容のテキスト版。

          WayBackMachineに残っている最新は今年4月のもの [archive.org]で、この時点では全780行のうちiraqが含まれるエントリは10しかない。

          そして、現在のrobots.txt [whitehouse.gov]には「Disallow:.*/iraq」が768行含まれている。単純なスクリプトで生成したらしく、そのうち実際に存在しているディレクトリ [bway.net]は約75個。

          つまり、

          単にサーバー負荷を減らすためでしょ。
          考えすぎ。

          ということは、
          ・今年4月以降になって突然robotによるクロールが激増したので、
          あるいは
          ・今年4月以降になって突然「/特定のキーワード」をDisallowするというアイデアを思いついたので、

          ・全ディレクトリのほんの一部でしかない.*/iraqに対する、
          ・スパイダーによるアクセスのみ
          を禁止して負荷軽減を図った、という意味ですね?


          アクセス多そうなところから対策するのは、対策ものの基本かと。
          # 自明なのでAC

          #422528さんにとって他にはどんなことが自明なのか考えただけでワクワクします。
          とりあえず、何か責任ある「対策もの」を担当していらっしゃらないことだけをお祈りします。
          親コメント
        • by Anonymous Coward
          お役所は納税者の関心の高い情報から規制するのが基本
          ってことですね。
        • by Anonymous Coward
          googleにキャッシュしてもらった方がいいのでは?

UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie

処理中...