アカウント名:
パスワード:
サーバー設計者のプロの見立ては一般人とはだいぶ違うようです。
https://twitter.com/ippo_n/status/1311572556726509568 [twitter.com]
東証の障害。共有ストレージのメモリ故障で生殺しになり自動フェイルオーバーせず発生。この手の障害は避けるの難しいだけに気の毒。16年3月にANAの Catalyst 4948E 起因のシステム障害も生殺しでフェイルオーバーしない事案だった。低レイヤーで生殺し障害出ると切り分け難しい。早期停止判断はGJだね
東証cioは誰?横山隆介の大学など学歴は?wiki [koregasiritai.com]
同日の午後4時に東証が記者会見を開き、システム障害が発生した経緯や原因について記者の質問に答えていましたが、東証cioの受け答えに賞賛の声が相次いでいます。
東証は、あの会見といいスピーディな判断といいCIOがキレキレでしたなそれでいて、学歴が情報系でもなければ理系ですらない点は、控えめに言ってチート能力の持ち主だろ
これらに対して読売新聞とか朝日新聞のたたきっぷりといったらないなと思った。
久々に「生殺し」を聞きました
昔Sun Microsystemsサーバーの冗長構成で常用系に障害が出るもハートビートは正常だったのでフェイルオーバーしなかったのを思い出しましたしかも主サービスは一見正常に動作していたためサービスを監視していてもNGという状況
生殺し は悪夢です
ハートビート発信の為にどの程度の診断を要するべきか、難しいなぁ……定期的に主処理を止めてメモリテスト走らせる位のコスト掛けても、処理中に挟み込める程度のテストでは特定のビットパターンで確率的にエラーみたいなのは引っかからんし。そもそもデータ壊れたまま動く類だと、壊れたデータを解釈失敗するレイヤでしか障害でないし。
冗長系と低レベルで同期取って入出力データの相違を複数の監視系統でモニタするくらいやればどうにかなるのだろうか?
記事中でコメント出してる専門家の現場勘の無さも気になるよ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家
共有ストレージのメモリ故障で生殺しになり自動フェイルオーバーせず発生 (スコア:5, 参考になる)
サーバー設計者のプロの見立ては一般人とはだいぶ違うようです。
https://twitter.com/ippo_n/status/1311572556726509568 [twitter.com]
東証cioは誰?横山隆介の大学など学歴は?wiki [koregasiritai.com]
https://twitter.com/ippo_n/status/1311572556726509568 [twitter.com]
これらに対して読売新聞とか朝日新聞のたたきっぷりといったらないなと思った。
Re:共有ストレージのメモリ故障で生殺しになり自動フェイルオーバーせず発生 (スコア:1)
久々に「生殺し」を聞きました
昔Sun Microsystemsサーバーの冗長構成で常用系に障害が出るも
ハートビートは正常だったのでフェイルオーバーしなかったのを思い出しました
しかも主サービスは一見正常に動作していたためサービスを監視していてもNGという状況
生殺し は悪夢です
Re: (スコア:0)
ハートビート発信の為にどの程度の診断を要するべきか、難しいなぁ……
定期的に主処理を止めてメモリテスト走らせる位のコスト掛けても、
処理中に挟み込める程度のテストでは特定のビットパターンで確率的にエラーみたいなのは引っかからんし。
そもそもデータ壊れたまま動く類だと、壊れたデータを解釈失敗するレイヤでしか障害でないし。
冗長系と低レベルで同期取って入出力データの相違を複数の監視系統でモニタするくらいやればどうにかなるのだろうか?
Re: (スコア:0)
記事中でコメント出してる専門家の現場勘の無さも気になるよ。