アカウント名:
パスワード:
>無停電機能を外して電源設備の更新作業を行って
UPSとかって、壁コンセント---UPS---サーバーのようにシリーズにつなぐもので、外すためには一度サーバーを落とさなければならないと認識しているのですが、文字通りサーバーを落として、配線を繋ぎ変えて、またサーバー立ち上げてたんですかね?
設備としてのUPSをバイパスするような経路とスイッチを用意してあったってことなのかな。
普通の(ラックマウントの)サーバーは、電源ユニットが2つ以上ついています。電源ケーブルもそれぞれにささります。1本が生きていればサーバは動くので、片系の電源設備を落としても、サーバは落ちません。
あと、UPSも、あなたがAPCとかの箱型のUPSを想像しているのであれば、それは違います。 https://www.ntt.com/business/services/data-center/colocation/nexcenter... [ntt.com] こういう感じのやつです。
まっとうなデータセンターであれば、複数の変電所から電源をとります。つまり、ラックマウントされたサーバに2本の電源ケーブルが伸びて
障害原因受電用屋内設備分電盤の過電流継電器の整定不具合により、常用受電が自動遮断しました。遮断時は、常用受電から予備受電に無停電で切り替わる機能を有しておりますが、今回の電源設備更新作業にあたってこの機能を外して行う工程(10分間を予定)中に事故が発生したため、電源停止(7秒間)となりました。その間当社からお客さまサーバ類への電源供給が失われ、お客さまサービスに影響を及ぼしました。
データセンターの電源障害による停止について(障 [qtnet.co.jp]
過電流継電器(OCR)は、普通は高圧側にあるので、電源が落ちたのはUPSの二次側ではなく一次側だと思いますよ。受電用とありますし。
キュービクル(屋内/屋外)──UPS──低圧分電盤──サーバ
OCRはキュービクル内の変圧器(トランス)の上に取り付けられています。
冗長性のないUPSを保守バイパス回路に切り替えて作業中に、OCRの誤動作でトリップしサーバーへの給電が停止、キュービクルにある自動切り替えスイッチ(ATS)で予備受電に切り替わるまでに7秒掛かったと。本来はUPSで保護できるけれど、保守バイパス回路だったのでそのままサーバまで止まってしまったということでしょう。
大型UPSを冗長性なしで運用するデータセンターが、本当に存在するのか疑問ですが。
https://www.qtpro.jp/cloud/qicdc/ [qtpro.jp] ここ見る分にはこの会社の提供するデータセンターはどれも無停電電源装置込で冗長構成してるはずだし、サーバーラックまでの電源引き込みも2系統あると取れなくもないイラストなんだけど……イラストはテキトー過ぎてアテにならんね。受電設備が免震範囲内でUPSや発電機が外?電力は都合三回出入りするの?
更新中の機器がUPSであってもUPS片肺で動くはずだし、2系統のままラックまで引き込んでれば切り替えるまでもなく落ちない。少
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人はmoriwaka -- Anonymous Coward
ここが分からん (スコア:0)
>無停電機能を外して電源設備の更新作業を行って
UPSとかって、壁コンセント---UPS---サーバーのようにシリーズにつなぐもので、
外すためには一度サーバーを落とさなければならないと認識しているのですが、
文字通りサーバーを落として、配線を繋ぎ変えて、またサーバー立ち上げてたんですかね?
設備としてのUPSをバイパスするような経路とスイッチを用意してあったってことなのかな。
Re: (スコア:0)
普通の(ラックマウントの)サーバーは、電源ユニットが2つ以上ついています。
電源ケーブルもそれぞれにささります。
1本が生きていればサーバは動くので、片系の電源設備を落としても、サーバは落ちません。
あと、UPSも、あなたがAPCとかの箱型のUPSを想像しているのであれば、それは違います。
https://www.ntt.com/business/services/data-center/colocation/nexcenter... [ntt.com]
こういう感じのやつです。
まっとうなデータセンターであれば、複数の変電所から電源をとります。
つまり、ラックマウントされたサーバに2本の電源ケーブルが伸びて
Re: (スコア:0)
データセンターの電源障害による停止について(障 [qtnet.co.jp]
Re:ここが分からん (スコア:0)
過電流継電器(OCR)は、普通は高圧側にあるので、電源が落ちたのはUPSの二次側ではなく一次側だと思いますよ。受電用とありますし。
キュービクル(屋内/屋外)──UPS──低圧分電盤──サーバ
OCRはキュービクル内の変圧器(トランス)の上に取り付けられています。
冗長性のないUPSを保守バイパス回路に切り替えて作業中に、OCRの誤動作でトリップしサーバーへの給電が停止、キュービクルにある自動切り替えスイッチ(ATS)で予備受電に切り替わるまでに7秒掛かったと。
本来はUPSで保護できるけれど、保守バイパス回路だったのでそのままサーバまで止まってしまったということでしょう。
大型UPSを冗長性なしで運用するデータセンターが、本当に存在するのか疑問ですが。
Re: (スコア:0)
https://www.qtpro.jp/cloud/qicdc/ [qtpro.jp]
ここ見る分にはこの会社の提供するデータセンターはどれも無停電電源装置込で冗長構成してるはずだし、
サーバーラックまでの電源引き込みも2系統あると取れなくもないイラストなんだけど……
イラストはテキトー過ぎてアテにならんね。
受電設備が免震範囲内でUPSや発電機が外?電力は都合三回出入りするの?
更新中の機器がUPSであってもUPS片肺で動くはずだし、
2系統のままラックまで引き込んでれば切り替えるまでもなく落ちない。
少