パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

緊急事態発生」記事へのコメント

  • で、その kernel ごと暴走したと思われるマシンの kernel dump は取得されましたか?

    さ、みんなで デバッグ祭りだ (^o^)/

    --
    fjの教祖様
    • (等のハードウェア障害)の可能性の排除が、この比較的低頻度且つ重篤な症例の場合には、ソフトウェアバグの特定の前提かと。各層のキャシュの障害の可能性も考えると、主メモリ及び各層キャシュのダンプを採るにも予め専用のハードウェア等の具備が必須でしょう。

      # 原因が何にせよWDTとかで自動で再起動(、予備系への代替又は死亡フラグ掲揚)ができないのか? だとしたら∗n∗x系OS(当然Win∗は論外)の家電や軽鯛等への安易な搭載は危険ですね。ましてフェイルセーフが難しい医療や運輸交通やエネルギーや宇宙等への適用は(現時点では)止めですな。
      • > WDTとかで自動で再起動(、予備系への代替又は死亡フラグ掲揚)ができないのか?

        そー言う展示を今年のITproEXPOで山ほど見てきました。プロセスが死んでるか生きてるか監視して、死んでるのを確認したらプロセス単位で予備系に切り替えるとか、そのプロセスが走ってる仮想サーバを予備系に切り替えるとか、その切戻しとか。

        医療用機器のように瞬断がむちゃくちゃクリティカルな現場では採用されてるかどうかわかりませんが、家電のように瞬断程度なら問題ないとこならそれでいいのかも。

        --
        KyaTanaka
        親コメント

開いた括弧は必ず閉じる -- あるプログラマー

処理中...