パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

UNIXサーバはリブートすべきでない説」記事へのコメント

  • by Anonymous Coward on 2011年02月23日 19時03分 (#1907337)

    >リブート後には再現されない恐れがある。
    問題は解消され、かつ、二度とその問題が起こらないのであれば、
    リブートするのは極めて合理的な解決策である(キリッ

    • by Anonymous Coward

      問題の解消と問題の究明は似ているようで違うんだよね...

    • by Anonymous Coward

      原因を特定できなければ、再発する恐れはあるので、
      「二度とその問題が起こらない」と果てして言えるかしら。

      • by camelus (41736) on 2011年02月23日 20時04分 (#1907382) 日記

        Windowsの再起動すれば直る話は
        要はリソース漏れなんだからマシンごと再起動すればいいよ!
        っていうのが大きいと、原因はある程度認識されてると思ってる。

        画面A→画面B→画面A と辿ると2度目のAでおかしくなる、みたいな場合でも
        (アプリにしろOSにしろ)再起動すればゴミが消えてまた動くようになる事も多いので
        とりあえず再起動するのはアリだと思う。(このツリーのサブジェクト的に考えれば)

        画面Aで立ち止まって原因を調べないといけない、ってのはやはりプロの見方だし
        >「二度とその問題が起こらない」と果てして言えるかしら。
        そもそもエンドユーザなら何度同じことが起きても再起動するだけなので、原因はどうでもいいのでしょう。

        # NT系じゃない方が主流だった時代に比べたら頻度も減ったし、1回あたりの時間も短くなっていってるし。

        親コメント
        • Re:エンドユーザの視点 (スコア:2, すばらしい洞察)

          by USH (8040) on 2011年02月23日 21時59分 (#1907438) 日記

          今回重要なのは、

                        「UNIXサーバ」をリブートする

          かどうかではないのかな。

          デスクトップなら、使っている自分の範囲で影響が限定できるけど、
          サーバはそうはいかない。
          逆にサーバを、「なんか変だからリブートするね」と毎回やられると、
          悲鳴があちこちで。

          # 自動アップデートにしてある Windows のファイル共有で、なんど泣かされたことか。

          親コメント
      • by cm (41778) on 2011年02月28日 22時56分 (#1910035)

        >原因を特定できなければ、再発する恐れはあるので、

        原因を特定できないで、ずっと待っている羽目に陥る恐れがあるので、
        「原因究明してから再度動かせ」も、言えない面があるわけなんだな。

        半年に一回壊れる、原因究明が出来ない、じゃ壊れてもよい様にしておけ..
        というのも、問題の解消ということになるんだな。

        問題が問題なのは、害があること。つまり、問題の問題となっている害をなくせば、それなりに問題解決。

        IT業界、不思議なところで、ダンプとってもログ読んでもわかんないこともある。
        結構な確率で調査は長期化する(ユーザにとっては1時間でも長期化と判断する)。

        そして、まさに時間を失うことが「害」という局面がよくあることで、
        それを最小限にする、問題があっても時間を失わない様にするといった
        ことも、原因究明より「手早くできる」ということなんだな。

        # ライト付いてますか?にも、こんな感じの話があったよな。

        親コメント
        • by Anonymous Coward
          > IT業界、不思議なところで、ダンプとってもログ読んでもわかんないこともある。

          それを分かっているのに、100%確実に分かることを要求しているんですね、鬼だな。

          > 結構な確率で調査は長期化する(ユーザにとっては1時間でも長期化と判断する)。

          それを分かっているのに、ダンプとっている間にサービスが止まるようなシステムを組むわけだ。

          自分たちがやるべきことをやらずに、それで生じる損害を、社外の誰かのせいにしてるわけだね。
          そういうやりかたしたいなら、そんなクズな客を相手にしている、本質的には保険屋みたいな会社に構築から運用管理まで全部たのみなよ。
          • by cm (41778) on 2011年03月01日 1時14分 (#1910076)

            >それを分かっているのに、100%確実に分かることを要求しているんですね、鬼だな。

            そうなんだよね、率が悪いとかわかっていながら、解析しますという契約だしてくるってのが、鬼の様に馬鹿ですよね。
            そして、解析失敗続きなのに、なにも用意せずに同じことをやっている。
            ちゃんと「次はログが採れる様にします」「ログレベルを変えます」「事象発生前の挙動から、何かわかる様にします」といったことを言えばいいのにね。

            >それを分かっているのに、ダンプとっている間にサービスが止まるようなシステムを組むわけだ。

            なので、ダンプが意味がないということを、少なくともそのベンダーのについては証明されちゃったんだな。
            ダンプをできるだけ正確にとりたいので、結線とか換えるな,,クラスタが困るぞ..とかね
            なんというか、理屈に合わないことをやっているベンダーさんなんだよな。

            >自分たちがやるべきことをやらずに、それで生じる損害を、社外の誰かのせいにしてるわけだね。

            え?あのベンダーがどこかに丸投げしちゃっているんですかね?
            でも、糾弾の先はあそこなんだけどね。

            >そんなクズな客を相手にしている、本質的には保険屋みたいな会社に構築から運用管理まで全部たのみなよ。

            まぁ、ちゃんとサービス継続していますからねぇ。
            サービスとめて調べさせてくれ、無駄だったよね?何か改善したの?
            こちらは色々と別サーバへの移管を含めてやっているよ、ベンダー違うけど、そっちでは動いていたりするからね。
            でもって、そっちの方が迅速だったりするわけなんですな。

            で、リブート以外の確実かつ迅速な方法を提案できないクズが何か言っても、全然無力だよ。
            リブートを含めて、迅速にやれないお方が何か言ったところでね、でもACちゃんだと無理だろうね。
            がんばって、無駄な調査したいんです!と言い続けるだけの自称エンジニアみたいな無駄で害悪になる糞は、できるだけシステムに近づけない方がよいという結論だな。

            親コメント
            • by Anonymous Coward
              >>それを分かっているのに、100%確実に分かることを要求しているんですね、鬼だな。
              > そうなんだよね、率が悪いとかわかっていながら、解析しますという契約だしてくるってのが、鬼の様に馬鹿ですよね。

              本当に、ダンプを解析することで必ず原因を判明させるという契約なのか? あなたの誤解ではなくて?

              > そして、解析失敗続きなのに、なにも用意せずに同じことをやっている。

              ま、原因がなかなか分からないこともあるさ。

              > ちゃんと「次はログが採れる様にします」「ログレベルを変えます」「事象発生前の挙動から、何かわかる様にします」といったことを言えばいいのにね
              • by cm (41778) on 2011年03月01日 20時30分 (#1910525)

                >ダンプを解析することで必ず原因を判明させるという契約なのか? あなたの誤解ではなくて?

                はい、解明しますと営業さんは言っていて、それの議事録があるわけです。

                >そりゃ口先だけで済むなら、言うだろうが、そうは言えない事情もあるのでしょう?

                そうなの?低能ば馬鹿ベンダーの都合はどうでもいいからね。
                こちらは可用性をあげるというお仕事をしているので、嘘でたらめ
                を言ったベンダーについては相手にしないことが多くなるという
                当たり前のことだったりします。

                >じゃぁ、そのベンダーと、そのベンダーを選定した、あなたの会社の人間を切るべきだ。

                はい、別部署に送られましたね。
                というか、人が結構異動するので、元が誰か?なんてことを調べる閑があったら、システムを改善しています。

                >「自分たち」というのは、あなたと、あなたの会社のことだ。

                じゃ、丸投げなんてことはしていませんな。
                解析業務をやって解明するという嘘をいったのを、その害悪を減らすという当たり前をやっているわけです。
                当然、その後も同じ状況なら営業さんごと切られますけどね。
                実際、ベンダーを切り替えられているのも結構あるからね。

                だけど、なぜかOracle切らないのかなぁ..と不思議なんですが、
                これはわたしらがやっている分野とはちょっと違うので「また
                Oracle暴れているよ、お客さんも怒っているよ、がんばって
                くださいね」とかね。

                責任分担が明確だと、こういったことも出来るわけです。

                親コメント
              • by cm (41778) on 2011年03月01日 23時47分 (#1910590)

                >ま、原因がなかなか分からないこともあるさ。

                そうなんだよね。で、解析して突き止めますとかで、ダンプ/ログ、サーバ外のネット系の状況ならDBサーバやら別のサーバとかも調べる。
                でも、わからないことがあるってのは、こちらも協力する。
                それがことごとく無駄になっているという状況に危機感がない馬鹿なベンダーさんが、馬鹿だから、解析します!時間をください!だけ。

                判らないことがあるさ..で放置しておけるレベルの仕事しかしていない方もいらっしゃるのは、理解しています。
                特に低能というか技術者とは言えないレベルの方々がそういった仕事に従事されていらっしゃるということをね。

                ほら、あなたも代案だせないじゃないですか?
                「こういう理由だったから判明できなかったと思われる、こういった事例もある」といったことを示す程度も出来ない方々は、あまりわたしの近辺にはおりませんが、たまに混じってくるので、困り者。
                つまり、その程度で技術云々しちゃうあなた程度のお方は、あまりサービス提供/維持といったお仕事はあっていない(無理とも言うかな?)ということなんでしょう。

                次は、ACさん、がんばって代案だしてちょうだいね。
                代案ださないで、こっちがどうとか言っても、回しているからねぇ、サービスまわせない低能が騒ぐのは、面白いけどね。
                馬鹿の踊りを見て、ちょっと嗤う程度ですが...がんばって、次は提案どうぞ。

                親コメント
      • by Anonymous Coward

        >原因を特定できなければ、再発する恐れはあるので、
        >「二度とその問題が起こらない」と果てして言えるかしら。

        問題が再現しなければ、再発する頻度が分らないじゃないか。
        3年に一度の現象ならOSのアップデートを待ってもいいし
        3日後に再現するなら、解決策を考えればいい。

        日常ほかにやることがないなら、3年に一度の現象を解明して
        OSSコミュニティに貢献してやってもいい。

    • by Anonymous Coward
      そして問題が解決されないばかりか悪化したり、二度と起動しなくなったり
      • by cm (41778) on 2011年02月24日 1時05分 (#1907516)

        >そして問題が解決されないばかりか悪化したり、二度と起動しなくなったり

        それはそれで再構築フェーズに入るので、了解とれそうだから問題ないな。
        問題解決を待って10年前にサーバ止めたままですとかね。
        原因究明を待てというのは、実際的でないことが結構あるからね。

        親コメント

あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー

処理中...