パスワードを忘れた? アカウント作成

障害が続いていたファーストサーバのホスティングサービス「Zenlogic」、復旧」記事へのコメント

  • by Anonymous Coward

    キャッシュが詰まったのか、バランシングに失敗してオンメンテでは何ともならなくなったのか

    • by Anonymous Coward on 2018年07月11日 10時33分 (#3441194)

      状況も環境もわからない部外者からみた原因の想像。
      妄想なので多分ハズレ。

      分散ストレージCephを使って巨大ストレージを構成し、多数の仮想環境が共有する形でクラウドを構築。

      いまどきの仮想サーバではよくある「動的メモリ」割り当てをして大量のユーザーを突っ込む。

      仮想マシンのテンプレートを適当に作り、それをユーザにコピーして使い回し。
      適当に作ったので余計なプロセスは生きたままだったり、メモリ使用量が多いプロセスも全体的に多数起動。

      動的メモリ割り当てだったため、多数の仮想マシンのメモリ使用量が一斉に上がるとswapを使い出すことになり、共有ストレージの負荷が上がる。

      実メモリ不足、共有ストレージの負荷が上がることでサーバが過負荷に陥り、ユーザーが他社サービスに移行し始める。
      その作業でrsyncとかを使ってネットワーク越しにデータをコピーし始める。
      rsyncが大量に起動されることで、さらにメモリとストレージの負荷が高まる。

      そしてさらに負荷が高まっていき…。

      契約者が激減したらメモリ不足も解消して快適になるかもね。

身近な人の偉大さは半減する -- あるアレゲ人

処理中...