アカウント名:
パスワード:
AWSも電源トラブルだったようですが,データセンタにおいて電源廻りはウィークポイントになりやすいのでしょうかね?
オペレータが蹴躓いてコードを抜いちゃった系は置いといて.
データセンタは、極論すると「場所」と「電力」と「冷却」を売っている所になりますかね。その中で一番、メンテナンスが難しいところが電力周りになります。(冷却も電力を使いますが、最近は自然冷却を売りにしている所も多くなっているので分けました)
電力の部分についてはこんな感じの構成になります。かね?・電力会社(東京電力、東北電力など発電会社が分かれている、発電所が分かれている)・受電方式(2重、スイッチ、単など、発電所から建物が電気を受け取る線の冗長性)・自家発電機(燃料による自家発電。大体3時間から半日くらいもつケースが多いみたい)・UPS(蓄電池。億単位で揃えたとしても10分程度しか持たない。)・分電板(各部屋への電力分岐)
この中でデータセンタとして多いトラブルは「UPS故障」「分電板故障」「電力切替のミス」あたりですかね。以前にラックルームが煙でいっぱいになっていて、原因が分電板が燃えていたなんてことも。
で、UPSを使うケースというのは受電方式を切り替えるタイムラグや、自家発電機を回す為の時間を稼ぐ為というのが主になります。そのように稼動する為には障害が起こって気づいてから切替という訳にはいかず、ほぼ直結上に置かなければなりません。(交換の為に迂回路があったり、完全な直結であるというわけではありませんが)そのUPS自体で障害が起こると結構手がつけられません。ある意味では電線切っちゃったみたいにな事態になります。無論、UPSの冗長化も可能なのかもしれませんが、非常に高価になってしまうでしょう。(UPS系統を分けておき、一部UPSで障害がおきても影響が一部に留まる様な設計もあるかと思います。どこかで聞いたような?)
後は交換時や実障害時のトラブル。UPSの稼動試験などは、易々とは行えないので稼動時に切り替わりが上手く行われない事があります。各設備はそれぞれメンテナンスや交換で構成が変わりますので、その時に連動が切れてしまうのでしょう。(サーバリプレース時に切り替え試験ができない状態のまま、運用せざるを得ない状況だと考えてください)
まぁデータセンタのUPSは上記のように、受電方法の切り替えの時間稼ぎが主な役割です。データセンタにUPS経路が冗長化されているか確認したり、自分のラックにデータセンタ故障時の対策用UPSを置くのもありです。これはデータセンタのUPS故障が直るまで保たれなければならないので時間想定が難しいですが。以前にバッテリーが付いたサーバだかが話題にでましたが、あれはあれでいい発想だと思ってます。
# 運用畑が経験したり聞きかじった情報ですので100%信じないでください。職募集中。
>データセンタは、極論すると「場所」と「電力」と「冷却」を売っている所になりますかね。「通信回線」を売っているところじゃなかったんですか?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy
電源トラブル (スコア:1)
AWSも電源トラブルだったようですが,データセンタにおいて電源廻りはウィークポイントになりやすいのでしょうかね?
オペレータが蹴躓いてコードを抜いちゃった系は置いといて.
Re:電源トラブル (スコア:3)
データセンタは、極論すると「場所」と「電力」と「冷却」を売っている所になりますかね。
その中で一番、メンテナンスが難しいところが電力周りになります。
(冷却も電力を使いますが、最近は自然冷却を売りにしている所も多くなっているので分けました)
電力の部分についてはこんな感じの構成になります。かね?
・電力会社(東京電力、東北電力など発電会社が分かれている、発電所が分かれている)
・受電方式(2重、スイッチ、単など、発電所から建物が電気を受け取る線の冗長性)
・自家発電機(燃料による自家発電。大体3時間から半日くらいもつケースが多いみたい)
・UPS(蓄電池。億単位で揃えたとしても10分程度しか持たない。)
・分電板(各部屋への電力分岐)
この中でデータセンタとして多いトラブルは「UPS故障」「分電板故障」「電力切替のミス」あたりですかね。
以前にラックルームが煙でいっぱいになっていて、原因が分電板が燃えていたなんてことも。
で、UPSを使うケースというのは受電方式を切り替えるタイムラグや、自家発電機を回す為の時間を稼ぐ為
というのが主になります。
そのように稼動する為には障害が起こって気づいてから切替という訳にはいかず、ほぼ直結上に置かなければなりません。
(交換の為に迂回路があったり、完全な直結であるというわけではありませんが)
そのUPS自体で障害が起こると結構手がつけられません。ある意味では電線切っちゃったみたいにな事態になります。
無論、UPSの冗長化も可能なのかもしれませんが、非常に高価になってしまうでしょう。
(UPS系統を分けておき、一部UPSで障害がおきても影響が一部に留まる様な設計もあるかと思います。どこかで聞いたような?)
後は交換時や実障害時のトラブル。
UPSの稼動試験などは、易々とは行えないので稼動時に切り替わりが上手く行われない事があります。
各設備はそれぞれメンテナンスや交換で構成が変わりますので、その時に連動が切れてしまうのでしょう。
(サーバリプレース時に切り替え試験ができない状態のまま、運用せざるを得ない状況だと考えてください)
まぁデータセンタのUPSは上記のように、受電方法の切り替えの時間稼ぎが主な役割です。
データセンタにUPS経路が冗長化されているか確認したり、自分のラックにデータセンタ故障時の対策用UPSを置くのもありです。
これはデータセンタのUPS故障が直るまで保たれなければならないので時間想定が難しいですが。
以前にバッテリーが付いたサーバだかが話題にでましたが、あれはあれでいい発想だと思ってます。
# 運用畑が経験したり聞きかじった情報ですので100%信じないでください。職募集中。
Re: (スコア:0)
>データセンタは、極論すると「場所」と「電力」と「冷却」を売っている所になりますかね。
「通信回線」を売っているところじゃなかったんですか?