パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Linuxクラスタで世界2位のスパコン」記事へのコメント

  • 米バージニア工芸大学の Power Mac G5 1,100 台を使ったクラスタ [srad.jp]では、ハードウェアの総額は 520 万ドルであったということでしたが、今回の Itanium2 を使用したクラスタは、ハードウェア費用でいくらぐらい掛かったんでしょう?

    --
    むらちより/あい/をこめて。
    • Re:お値段は? (スコア:2, すばらしい洞察)

      それも判るけど、最終的にはどの程度の信頼性を必要とするかでしょう。

      一時間の計算を1000個するのと1000時間の計算を1個するのと
      要求される信頼性は全く別になります。
      計算に冗長性が期待できないなら、一台のダウンで期待値として30分
      • by Anonymous Coward on 2004年05月18日 0時35分 (#550336)
        この手のシステムって、故障したら予備系統を使うとか、そういうシステムにはなっていないのですか? 途中結果の保存もできると思いますし。
        親コメント
        • 生死判定 (スコア:2, 参考になる)

          by gigo (21150) on 2004年05月18日 6時18分 (#550455)
          計算途中で死んだり、暴走しているノードをどうやって見つけたらよいでしょう。1個1個のノードがunixコマンドを実行しているとして、応答がないのは、死んでいるのか実行に時間がかかっているのか分かりません。それでは困るので、生死判定のための通信を一定時間おきにするそうですが、ノード間の通信が非常に多くなってネットワークの速度低下が起こると、それも届かなくなります。そのため、制御用には別ネットワークを組んだりしますが、あるノードが死んだ時にデータを別のノードへ移すなどと考え始めると、爆発的に処理、通信量が増えて共倒れになることが考えられて、一般的なフェイルオーバーは難しいです。
          親コメント

日々是ハック也 -- あるハードコアバイナリアン

処理中...