アカウント名:
パスワード:
>無停電機能を外して電源設備の更新作業を行って
UPSとかって、壁コンセント---UPS---サーバーのようにシリーズにつなぐもので、外すためには一度サーバーを落とさなければならないと認識しているのですが、文字通りサーバーを落として、配線を繋ぎ変えて、またサーバー立ち上げてたんですかね?
設備としてのUPSをバイパスするような経路とスイッチを用意してあったってことなのかな。
まず、よくあるスタンドアロンUPSってわけじゃないとは思う(記事があんまり読めないのでわからない)...
で、サーバ系は電源を2系とかもてるので、片側の系のを落すこと自体は可能だし、その手順で更新すること自体は問題ないはず。
問題は...「無停電機能を外して電源設備の更新作業を行っている最中に電力の供給元が予備電源に切り替わり」ってことだよな...電源更新(根っこ側)するにしても、まずUPSを万全にしてからやらなきゃだめだと思うので、その意味で手順ミスったように読める。
詳細を待つしかないかな...
普通の(ラックマウントの)サーバーは、電源ユニットが2つ以上ついています。電源ケーブルもそれぞれにささります。1本が生きていればサーバは動くので、片系の電源設備を落としても、サーバは落ちません。
あと、UPSも、あなたがAPCとかの箱型のUPSを想像しているのであれば、それは違います。 https://www.ntt.com/business/services/data-center/colocation/nexcenter... [ntt.com] こういう感じのやつです。
まっとうなデータセンターであれば、複数の変電所から電源をとります。つまり、ラックマウントされたサーバに2本の電源ケーブルが伸びて
>まっとうなデータセンターであれば、複数の変電所から電源をとります。
自前の変電所や発電設備を備えているDCの話はたまに聞きますね。どこまでお金をかけられるかで安全係数が決まりそう。
PSUを二系統抱いているサーバーで。片方のPSUをメンテしているときに、たまたま残りのPSUが壊れたこともあったっけ。
障害原因受電用屋内設備分電盤の過電流継電器の整定不具合により、常用受電が自動遮断しました。遮断時は、常用受電から予備受電に無停電で切り替わる機能を有しておりますが、今回の電源設備更新作業にあたってこの機能を外して行う工程(10分間を予定)中に事故が発生したため、電源停止(7秒間)となりました。その間当社からお客さまサーバ類への電源供給が失われ、お客さまサービスに影響を及ぼしました。
データセンターの電源障害による停止について(障 [qtnet.co.jp]
ああちゃんと設定したはずがちゃんと接続したはずがちゃんと製造したはずがだめでしたってパターンですね。
過電流継電器(OCR)は、普通は高圧側にあるので、電源が落ちたのはUPSの二次側ではなく一次側だと思いますよ。受電用とありますし。
キュービクル(屋内/屋外)──UPS──低圧分電盤──サーバ
OCRはキュービクル内の変圧器(トランス)の上に取り付けられています。
冗長性のないUPSを保守バイパス回路に切り替えて作業中に、OCRの誤動作でトリップしサーバーへの給電が停止、キュービクルにある自動切り替えスイッチ(ATS)で予備受電に切り替わるまでに7秒掛かったと。本来はUPSで保護できるけれど、保守バイパス回路だったのでそのままサーバまで止まってしまったということでしょう。
大型UPSを冗長性なしで運用するデータセンターが、本当に存在するのか疑問ですが。
https://www.qtpro.jp/cloud/qicdc/ [qtpro.jp] ここ見る分にはこの会社の提供するデータセンターはどれも無停電電源装置込で冗長構成してるはずだし、サーバーラックまでの電源引き込みも2系統あると取れなくもないイラストなんだけど……イラストはテキトー過ぎてアテにならんね。受電設備が免震範囲内でUPSや発電機が外?電力は都合三回出入りするの?
更新中の機器がUPSであってもUPS片肺で動くはずだし、2系統のままラックまで引き込んでれば切り替えるまでもなく落ちない。少
常時インバーターなのかCVCFなのかわかりませんけど、単純にバッテリー交換作業をしているときは無停電機能はOFF状態です。
その際、バッテリーからの給電ではなく商用電源にバイパスされますけど、そのバイパスされた瞬間に過大電流が流れて遮断装置が働いたのではないかと予想。
通常はサーバーのシャットダウンは必要ないですし、必要ないから稼働したままで作業してたってことです。
通常はバッテリーがバッファになって安定化していた物を、工事の為に直結にしたら突入電流で落ちちゃった、とかか。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ソースを見ろ -- ある4桁UID
ここが分からん (スコア:0)
>無停電機能を外して電源設備の更新作業を行って
UPSとかって、壁コンセント---UPS---サーバーのようにシリーズにつなぐもので、
外すためには一度サーバーを落とさなければならないと認識しているのですが、
文字通りサーバーを落として、配線を繋ぎ変えて、またサーバー立ち上げてたんですかね?
設備としてのUPSをバイパスするような経路とスイッチを用意してあったってことなのかな。
Re:ここが分からん (スコア:2)
まず、よくあるスタンドアロンUPSってわけじゃないとは思う(記事があんまり読めないのでわからない)...
で、サーバ系は電源を2系とかもてるので、片側の系のを落すこと自体は可能だし、その手順で更新すること自体は問題ないはず。
問題は...「無停電機能を外して電源設備の更新作業を行っている最中に電力の供給元が予備電源に切り替わり」ってことだよな...電源更新(根っこ側)するにしても、まずUPSを万全にしてからやらなきゃだめだと思うので、その意味で手順ミスったように読める。
詳細を待つしかないかな...
M-FalconSky (暑いか寒い)
Re: (スコア:0)
普通の(ラックマウントの)サーバーは、電源ユニットが2つ以上ついています。
電源ケーブルもそれぞれにささります。
1本が生きていればサーバは動くので、片系の電源設備を落としても、サーバは落ちません。
あと、UPSも、あなたがAPCとかの箱型のUPSを想像しているのであれば、それは違います。
https://www.ntt.com/business/services/data-center/colocation/nexcenter... [ntt.com]
こういう感じのやつです。
まっとうなデータセンターであれば、複数の変電所から電源をとります。
つまり、ラックマウントされたサーバに2本の電源ケーブルが伸びて
Re:ここが分からん (スコア:2)
>まっとうなデータセンターであれば、複数の変電所から電源をとります。
自前の変電所や発電設備を備えているDCの話はたまに聞きますね。
どこまでお金をかけられるかで安全係数が決まりそう。
PSUを二系統抱いているサーバーで。
片方のPSUをメンテしているときに、たまたま残りのPSUが壊れたこともあったっけ。
Re: (スコア:0)
データセンターの電源障害による停止について(障 [qtnet.co.jp]
Re: (スコア:0)
ああちゃんと設定したはずがちゃんと接続したはずがちゃんと製造したはずがだめでしたってパターンですね。
Re: (スコア:0)
過電流継電器(OCR)は、普通は高圧側にあるので、電源が落ちたのはUPSの二次側ではなく一次側だと思いますよ。受電用とありますし。
キュービクル(屋内/屋外)──UPS──低圧分電盤──サーバ
OCRはキュービクル内の変圧器(トランス)の上に取り付けられています。
冗長性のないUPSを保守バイパス回路に切り替えて作業中に、OCRの誤動作でトリップしサーバーへの給電が停止、キュービクルにある自動切り替えスイッチ(ATS)で予備受電に切り替わるまでに7秒掛かったと。
本来はUPSで保護できるけれど、保守バイパス回路だったのでそのままサーバまで止まってしまったということでしょう。
大型UPSを冗長性なしで運用するデータセンターが、本当に存在するのか疑問ですが。
Re: (スコア:0)
https://www.qtpro.jp/cloud/qicdc/ [qtpro.jp]
ここ見る分にはこの会社の提供するデータセンターはどれも無停電電源装置込で冗長構成してるはずだし、
サーバーラックまでの電源引き込みも2系統あると取れなくもないイラストなんだけど……
イラストはテキトー過ぎてアテにならんね。
受電設備が免震範囲内でUPSや発電機が外?電力は都合三回出入りするの?
更新中の機器がUPSであってもUPS片肺で動くはずだし、
2系統のままラックまで引き込んでれば切り替えるまでもなく落ちない。
少
Re: (スコア:0)
常時インバーターなのかCVCFなのかわかりませんけど、単純にバッテリー交換作業をしているときは無停電機能はOFF状態です。
その際、バッテリーからの給電ではなく商用電源にバイパスされますけど、そのバイパスされた瞬間に過大電流が流れて遮断装置が働いたのではないかと予想。
通常はサーバーのシャットダウンは必要ないですし、必要ないから稼働したままで作業してたってことです。
Re: (スコア:0)
通常はバッテリーがバッファになって安定化していた物を、
工事の為に直結にしたら突入電流で落ちちゃった、とかか。