アカウント名:
パスワード:
サーバーならHAでかかっても数分で切り替えられるように設計、構成するのが普通だし。
それとも落雷直撃対策用の完全オフライン待機系とかに切り替えに手こずったとか?まあ、SLA的にそのくらいの構成当然取ってるはずだが、普段使ってなくてあわてた感じですかねぇ?
「フロントエンドプロセッサ」という名前で想像されるサーバであれば、そもそも複数並列で利用するのが一般的な設計だと思うが。普通のラウンドロビンでも、接続元ごと固定的に割り当てる方法でもいいけど、いずれにしても1台落ちただけでは全滅はしない。CAFISってどういうアーキテクチャなんだろう。
完全な多重系は妄想の中では実現可能でも、現実世界では実現不可能ですから。でまぁ、ウィークポイントはいつか必ず突かれるっていうのが障害の世界ではお約束なわけだし。
一貫性を犠牲にして可用性と分割耐性を上げることはできます。独立した同等のシステムが高頻度に情報共有してる状態は、完全な多重系と言えるのでは?# 今回の例で言えば、別の会社が管理するネットワークを使っていたクレジットカード会社・小売店の組み合わせはセーフ。
ハードウェア障害は、ある瞬間にきれいにプッツンしてくれるとも限らないし、これだけの規模のシステムなら、原因調査に1.5時間くらいは、状況しだいで仕方ないかなあという気はする。
分単位でこけたら金融庁に報告義務があるそうです。https://twitter.com/acsol_one/status/640112589750407168 [twitter.com]
ただし2時間超えると「重大な通信事故」になるので、ソフトバンクの通信障害は(他社も同時にやらかした場合を除き)いつも1時間58分です。
東海道新幹線上りで新橋付近の車掌アナウンス、みたいなもん?(違# 車内の溜息というかどよめきというか。
ふーん
すいませんすいませんごめんなさいはんせいしてます
日経BPの記事でも公表していないと書いてあるので、オフレコでの説明があったかな?
そういう事態を想定した変更シナリオがない、現場に権限がない、事前訓練されていないじゃないかと。
特に「3割がダメで7割は稼働しているので、切り替えると7割にも影響を及ぼす」となると、判断が難しそう。※本当に7割動いてたかどうかはわからんけど、全滅じゃないと切替するかどうかの判断が難しいよね
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson
待機系切り替えに何で一時間も掛かる? (スコア:0)
サーバーならHAでかかっても数分で切り替えられるように設計、構成するのが普通だし。
それとも落雷直撃対策用の完全オフライン待機系とかに切り替えに手こずったとか?
まあ、SLA的にそのくらいの構成当然取ってるはずだが、普段使ってなくてあわてた感じですかねぇ?
Re:待機系切り替えに何で一時間も掛かる? (スコア:1)
「フロントエンドプロセッサ」という名前で想像されるサーバであれば、そもそも複数並列で利用するのが一般的な設計だと思うが。
普通のラウンドロビンでも、接続元ごと固定的に割り当てる方法でもいいけど、いずれにしても1台落ちただけでは全滅はしない。
CAFISってどういうアーキテクチャなんだろう。
Re: (スコア:0)
完全な多重系は妄想の中では実現可能でも、現実世界では実現不可能ですから。
でまぁ、ウィークポイントはいつか必ず突かれるっていうのが障害の世界ではお約束なわけだし。
Re: (スコア:0)
一貫性を犠牲にして可用性と分割耐性を上げることはできます。
独立した同等のシステムが高頻度に情報共有してる状態は、完全な多重系と言えるのでは?
# 今回の例で言えば、別の会社が管理するネットワークを使っていたクレジットカード会社・小売店の組み合わせはセーフ。
Re: (スコア:0)
ハードウェア障害は、ある瞬間にきれいにプッツンしてくれるとも限らないし、
これだけの規模のシステムなら、原因調査に1.5時間くらいは、状況しだいで仕方ないかなあという気はする。
Re: (スコア:0)
99.99とか99.95なら普通に保証の範囲内で再起動できましためでたしめでたしなんじゃないの。
Re:待機系切り替えに何で一時間も掛かる? (スコア:3, 興味深い)
分単位でこけたら金融庁に報告義務があるそうです。
https://twitter.com/acsol_one/status/640112589750407168 [twitter.com]
Re:待機系切り替えに何で一時間も掛かる? (スコア:1)
Re:待機系切り替えに何で一時間も掛かる? (スコア:1)
ただし2時間超えると「重大な通信事故」になるので、ソフトバンクの通信障害は(他社も同時にやらかした場合を除き)いつも1時間58分です。
Re: (スコア:0)
東海道新幹線上りで新橋付近の車掌アナウンス、みたいなもん?(違
# 車内の溜息というかどよめきというか。
Re: (スコア:0)
ふーん
すいませんすいません
ごめんなさいはんせいしてます
Re: (スコア:0)
日経BPの記事でも公表していないと書いてあるので、オフレコでの説明があったかな?
そういう事態を想定した変更シナリオがない、現場に権限がない、事前訓練されていないじゃないかと。
特に「3割がダメで7割は稼働しているので、切り替えると7割にも影響を及ぼす」となると、判断が難しそう。
※本当に7割動いてたかどうかはわからんけど、全滅じゃないと切替するかどうかの判断が難しいよね
Re: (スコア:0)
その落ち方は想定していなかったから監視ソフトが反応しなかったとか、
普段無視しているエラーと同じメッセージだったから監視ソフトが反応しなかったとか。
運用上だれかに認可をとらないとダメだったとか。