パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

UNIXサーバはリブートすべきでない説」記事へのコメント

  • by Anonymous Coward
    「問題が何かわからないけどリブートしたらなおるんじゃね?」という思考はWindowsであっても9x/Me時代の「神話」だと思いますよ
    • by Anonymous Coward
      今でも普通にやってます。
      • by Anonymous Coward
        それってXPとかVistaとか7でしょ。
        しかも不調になってじゃなくて、Updateとかで求められてからでしょ。

        Windows Serverは、UNIXサーバなんかと同様に数か月とか1年とか
        連続稼働させることもあるよ。
        もちろん使用環境によってはWindowsUpdateで再起動が必要な場合も
        あるけどね。
        • by Anonymous Coward
          とりあえずリブートすれば…っていうのはクライアントPCでの対処法ですよね。
          多種多様なソフトでユーザがごちゃごちゃといろいろ操作してトラブって、というような。

          サーバが問題起こしたってならUnixでもWindowsでも基本スタンスは一緒と思います。

          #ひょっとして意図的にごっちゃにしてるんだろうか
          • ええ、一緒ですね。

            とにかく対処したって言うために、とりあえずリブート。

            親コメント
            • Re:Windowsでも一緒 (スコア:2, 参考になる)

              by cm (41778) on 2011年02月24日 1時24分 (#1907522)

              >とにかく対処したって言うために、とりあえずリブート。

              それ以上に明確な理由で明確に短時間での復旧する手段を提示できたら、そちらを使うだろうね。
              代案なき反対が、まさに「リブートはだめ」議論の元にあるわけなんだよね。

              「こういう理由/理屈でリブートせずに調べたら判ります、リブートよりサービス影響はありません」というのを具体的に示して、それで実績を積んでから発言したらよいのにね。
              リブートで、少なくともその後にサービス戻りが出来た確率は、最近200回で198回。
              だめだった2件はサービスのログから原因究明できてしまった。

              対して、ダンプとった「おかげ」で理由がわかったのはほとんどなかった。
              大概は、残っていたログから判断されたものがほとんど。

              後日、再起動したサーバから取得したログで判明したのが数件あったが、リブートしてもしなくてもこれはわかったことになる。
              もし、原因究明まで待っていたとしたら、「全部後日なので24h×日数のサービス停止」と「直すのにやはりリブートが必要」で、結局ダメダメな成果しかあげられないというのが結論になるんだよな。

              リブートしちゃだめ、じゃ、別のより高確率かつ短時間な方法を提示しないとだめなのだが、それが出来ない癖に言う馬鹿(ソフトウェア開発系に多い)がいてるんですよね。

              親コメント
              • by Anonymous Coward
                たとえば、
                メモリに不良があって動作がおかしなPCのユーザーは、アプリケーションが例外で落ちても、リブートして使い続ける。
                アプリが例外で落ちるだけでなく、様々なファイルが破損している可能性があるのですが、ユーザーは気がつかない。
                なんていう例があるわけですが、あなたはサーバで同じようなことをしていませんか?
              • by Anonymous Coward
                作りっぱなしで原因究明を振られないソフトウェア開発者なんているの?
                適切なログはダンプに勝るってのは、原因究明やった人なら誰でも認識するんじゃないだろうか。
                リアルタイムにパッチ当てて解決出来るかをすばやく判断して、NGなら即リブート提案&ログ解析が普通だと思ってた。

                冗長化を前提に設計している場合は、また話は違うけど
              • by Anonymous Coward

                「作りっぱなしで原因究明を振られないソフトウェア開発者」は、仰る通りそうそういないと思いますが、
                「運用担当と同じレベルで連絡がつくソフトウェア開発者」も、そうそういないでしょう。

                開発者に連絡がつくまで、障害時のまま止めておくってのも厳しいんじゃないですかね。
                それが現実に起きるかどうかは別として、会社のポリシーとして。

              • by cm (41778) on 2011年02月24日 14時44分 (#1907792)

                >メモリに不良があって動作がおかしなPCのユーザーは、アプリケーションが例外で落ちても、リブートして使い続ける。

                それをしている。「メモリ壊れていてリブートかかっちゃうので修理しますか?」「金ないし、あと数ヶ月で除却なんでそのままにしてくれ」でやっているよ。

                >アプリが例外で落ちるだけでなく、様々なファイルが破損している可能性があるのですが、ユーザーは気がつかない。

                その危険性について説明して、「最悪、フルリストアで半日クラスタが崩れるがよいか?」とね。
                そして、オーナがどう判断するかに依存するからね。

                >あなたはサーバで同じようなことをしていませんか?

                以上、やっていますが、それで問題が減債される。
                で、リブートより高確率かつ迅速な復帰方法を示してから言おうね。
                そうでないと、「ダンプ時間かけてとってね....わかりませんでした」といった馬鹿連中と同じだよ。

                親コメント
              • by cm (41778) on 2011年02月24日 14時45分 (#1907793)

                >作りっぱなしで原因究明を振られないソフトウェア開発者なんているの?

                そういう契約もあるんだな。

                >リアルタイムにパッチ当てて解決出来るかをすばやく判断して、NGなら即リブート提案&ログ解析が普通だと思ってた。

                パッチがあるってことは、原因について判断されているわけだよな?
                それがあるなら、まったく違う話だろうね。

                親コメント
              • by Anonymous Coward
                > その危険性について説明して、「最悪、フルリストアで半日クラスタが崩れるがよいか?」とね。

                メモリ不良で誤動作するまま使い続けるのは、もっと酷いことになりそうだが。

                > リブートより高確率かつ迅速な復帰方法を示してから言おうね。

                メモリ交換

                なお、メモリにECCが無い時点で、賭けをしていることになるんです。
                メモリ不良という一例ではなく、UNIXサーバの運用管理という一般論でも、何だか分からないがリブートすれば治る、というやり方がマシだって場合は、それは賭けをしているってことなんです。
              • by cm (41778) on 2011年02月26日 3時52分 (#1908602)

                >メモリ不良で誤動作するまま使い続けるのは、もっと酷いことになりそうだが。

                それは当然、説明したよ。
                「今は金がないから、ない袖はふれない。データ全損しても、こちらで
                PCをたててその場しのぎをする。
                決裁が来年度発効なので、三ヶ月程度たてばサーバリプレースを依頼する」
                ということだったから、ま、通電とネットワーク死活監視程度をやっていた。

                >メモリ交換

                うん、決裁通してね。出来る?...www

                親コメント
              • by Anonymous Coward
                データ全損などと相手が言うってことは、あなたはメモリ不良の危険性を適切に説明しなかったんですね。
                メモリ不良の怖いところは、データのごく一部が、こっそりと化け、それに気が付かないことなんですよ。

                > うん、決裁通してね。出来る?...www

                故障部品の交換の都度で金がかかる、つまり、保守契約してないのか?
                保守契約なしって時点で論外なんだが。
              • Re: (スコア:0, 荒らし)

                >故障部品の交換の都度で金がかかる、つまり、保守契約してないのか?

                保守契約が期限ないとか思っているバカ、発見。

                >保守契約なしって時点で論外なんだが。

                切れたから次期決裁、なもんで、見る必要なしなんだな。
                で、そういったモノが存在することを想像できない低能さが論外。

              • by Anonymous Coward
                > 保守契約が期限ないとか思っているバカ、発見。

                運用期間よりも保守契約の期間が短いなんてナメてるとしか思えない。
                保守契約が切れた時点で、たとえサーバが正常に動作していても、もうそいつは故障したも同然の仕事には使えないゴミなんだよ。

                > 切れたから次期決裁、なもんで、見る必要なしなんだな。

                保守契約が切れてからリプレースのサーバを調達しようとするなんて、酷い話だな。

                > で、そういったモノが存在することを想像できない低能さが論外。

                そういう酷い会社もあるだろうけれど、そういう仮定・先入観で話をしたら、あなたに対して失礼でしょう?
              • by cm (41778) on 2011年03月01日 2時13分 (#1910093)

                >運用期間よりも保守契約の期間が短いなんてナメてるとしか思えない。

                なので、運用維持保守としては、なめた契約しかしないわけ。
                これだけ老朽化していると、だめでしょ?ということで、通電+ネット接続と温度湿度みたいな環境提供だけとなね。

                >保守契約が切れてからリプレースのサーバを調達しようとするなんて、酷い話だな。

                まぁ、会社の都合ってのもあるみたいで、元やっていた部署が消滅、でもデータ欲しいので最低限でやってね、新部署だから決裁まだ出せる状況じゃないし...みたいなことで、「じゃ、サービスレベルは見直してね」ってなことでやっているな。

                >そういう酷い会社もあるだろうけれど、そういう仮定・先入観で話をしたら、あなたに対して失礼でしょう?

                もちろん、そんなアホばかりだと、やっていけない。
                まともなベンダーさんも居ますよ。
                少なくとも、毎回ダンプとって、駄目でした...みたいな馬「も」いるってこと。
                ダンプとってわかんなかった、でも次はログとかもうちょっと取る様にするとか、もうちょっと状態監視も精密にするとか、不安定の検知を早めにするとか、そういった提案/再設計/実装を重ねて解析したり、解析できないまでも再発防止になったりというベンダーさんもいる。
                そういったベンダーさんだと、結構発言力もあるし、指示や依頼も的確で、それに応える方も仕事は増えるが、可用性がどんどんあがってくれてやりがいもあるってこと。

                少なくとも、前進しろや、前進を示せないクズは黙っていろってことな。

                親コメント
              • by Anonymous Coward
                >> 運用期間よりも保守契約の期間が短いなんてナメてるとしか思えない。
                > なので、運用維持保守としては、なめた契約しかしないわけ。

                なんか話が妙だと思ったら、もしかして運用維持保守だけを請け負う、オペレータの会社の人なの?
                そりゃ、問題があっても自分たちには解決しようがなく、文句をいったり手順書よこせと言うのが仕事だわな。
                鬱憤がたまり、社外の人間に当たり散らしたくなるのも分からないでもないが、しかし、そういう鬱憤を引き受けるのが、あなたの会社の仕事だったりしない? なぜ自前で運用しないかといえば、それをやるのは社員を無駄に疲弊させるから、なんだよね。
              • by cm (41778) on 2011年03月01日 20時12分 (#1910510)

                >運用維持保守だけを請け負う、オペレータの会社の人なの?

                いえいえ、オペレータだけじゃないんだよな。
                SEもCEもね。サービス提供の請負と思ってもらえるといいかな?

                >問題があっても自分たちには解決しようがなく、文句をいったり手順書よこせと言うのが仕事だわな。

                自己解決できる部分はやっているからね。
                そして、限界があるので、それについてベンダーなんかと契約しているわけだ。
                手順として出来が悪いモノについては、見直しやらもやっているからね。

                >鬱憤がたまり、社外の人間に当たり散らしたくなるのも分からないでもない

                そんな馬鹿なことは誰もしていませんけどね、あなたの会社にはそういう輩がいるんですかね?

                >しかし、そういう鬱憤を引き受けるのが、あなたの会社の仕事だったりしない?

                そんなあなたの会社ではありませんからね。
                で、代案は出るのかな?...無理だろうなぁ...ww

                親コメント

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

処理中...