パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

先週発生したGitHubの障害、発端はデータセンターの電源設備トラブル」記事へのコメント

  • DCでの事故原因として電源がよく上げられるけど、改善されない要因ってなんだろう。

    ・電源なんてあって当たり前なので管理がいい加減のまま。
    ・不安なので多重化しててもやっぱりどっかで事故っててきりがない。
    ・実は他に原因があるけど言い訳(スケープゴート)にされやすい。
    ・掃除のオバちゃんが黒幕。

    • コンピュータの電源に使われてるスイッチング電源は、大抵、整流した商用電源をFETのスイッチで制御して定電圧を供給していますが、途中途中に大容量の電解コンデンサやコイル・トランスを挟んで求められる安定度と直流の「きれいさ」(ノイズ輻射や電圧変動の小ささ)を確保している訳です。

      これらの部品は経年劣化するし、温度や負荷が高ければ劣化速度は加速します。
      特に、電解コンデンサには電子部品としては比較的短い寿命がありまして、 平均故障間隔 [wikipedia.org]が、少し前だと1,000〜2,000時間@105℃、長くても5,000時間で、最近になっていろいろ改善されたり材質が固体化されたりして、10,000時間@105℃の物が出始めた。
      電源内部が50℃

      • by nemui4 (20313) on 2016年02月02日 0時42分 (#2957962) 日記

        とあるメーカーのWSは、内部管理ツールで電源ユニット毎のファン稼働時間を積算していて一定時間毎に交換アラームあげてきますね。
        保守入ってたら定期的にCEさんがそれのlog見て交換していってる。
        同時に稼働しているはずなのに、並列の電源ユニットの交換タイミングがバラバラなのが不思議だけどわざとそうしてんのかな。

        親コメント
        • by Anonymous Coward

          わざとじゃないですかねえ。同時に同じロットのものを大量に交換した結果
          同じタイミングで大量に故障して焼け野原ってのを防ぎたいのじゃないかと。
          この辺実際運用に携わっている人の話を聞いてみたいです。

にわかな奴ほど語りたがる -- あるハッカー

処理中...