アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家
んだかねぇ。 (スコア:0)
そんなもの作って何になる?
分散処理するのとどっちが効率いい? とまぁ、PS3の方なんかを見てると思うわけで。
海の中に作れば水冷に困らなさそ。
Re:んだかねぇ。 (スコア:2, 参考になる)
って世の中で言っているものは、基本的にはほぼ全て並列・分散処理です。
(並列と分散のニュアンスの違いはとりあえず棚あげておいて)
ぶっちゃけ、地球シミュレーターだって、NEC の SX-6 を複数台並列処理させるだけだし、BlueGeneだって、IBM の POWER 5 を並列処理させているだけ。
だったら、PS3 の並列でもいいじゃん?というのはごもっともだけど、PS3 を10万台繋いで並列できるシステムを構築したら、スパコンを作るのと同じ値段がかかるという事です。今のスパコンは、(ものにも依るけど)そのくらい並列してます。
無論、POWER と
Re:んだかねぇ。 (スコア:-1, 荒らし)
上記コメントの価格に関する話は、ウソ。
そもそもベクタープロセッサはメモリ系を大量におごることで速度を確保するアーキテクチャだし CPU価格もPS3やPCのGFlops単価に比べ圧倒的に高い。
さらにスパコンの価格では開発費が占める割合は大きい。理由は単純で、数が出ないから。
民生用に大量に作るCPUのおこぼれを使うなら、ESに
Re:んだかねぇ。 (スコア:1)
これって、単精度浮動小数点演算のピーク速度じゃ?
倍精度浮動小数点演算の実効速度と比べないと意味がない。
測ったことはないけど、良くて 2GFlops 程度じゃない?
2GFlops の PC を 20000台組み合わせても、通信がネックになって
40TFlops なんて出せない。40000台にしても、
アムダールの法則によって、1台辺り 1GFlops になるだけで、
総合性能なんて上がらない。
専用の M/B やネットワークを開発するなら、総合性能を上げられるけど、
そうすると当然高くなるので、前提が崩れる。
ちなみに、cell でクラスタ組んだら、2GFlop
TomOne
Re:んだかねぇ。 (スコア:0)
CORE2は本当に2コアで倍精度24GFlops。実測でも出る。もちろんピークの100%は出ないにせよ1ノードなら90%以上出ることは確認済み。
計ったこともないのにデタラメ書かないで。
Top500のLINPACK性能が倍精度演算の結果だって知っているなら、こんなことは言わないよね。
TOP500リストみればわかるとおり、11位に入っているのがWoodcrest、この計測でも24GFlopsの
83%ぐらい、16GFlopsは出ている。
DELLのPowerEdgeで3GHzのWoodcrest
proc#: 5
Re:んだかねぇ。 (スコア:1)
ESが得意とするメモリキャッシュが効かない大規模計算だと、
メモリバンド幅やネットワークバンド幅が重要になってきます。
Woodcrest のメモリバンド幅は 10GB/s の様なので、
10GFlops が良い所でしょう。
さらにパソコンレベルが使えるネットワークなんて、
GbE か、せいぜいその 10倍止まり。
クラスタリングした時の性能は厳しくなるでしょう。
LINPACK はクラスタに有利なベンチマークです。
クラスタがベクトルに勝てるというなら、ベクトルに有利な
気象計算とか流体計算でベンチマークや実効性能を測らないと
いけません。
そう言う計算だとクラスタでは実行効率は 10% 以下に落ちてしまいます。
とすると、24GFlops の10% で 2.4GFlops。
そしてクラスタ数を上げれば上げるだけその効率は落ちていきます。
TomOne
Re:んだかねぇ。 (スコア:1)
> 10GFlops が良い所でしょう。
ごめん、間違えました。
10GB/s なので、1.25GFlops 程度じゃないかと。
と思って調べている内に、姫野ベンチの結果を見つけました。
Xeon 5150(Woodcrest) 2.66GHz で 1.7Gflops しか出ていません。
2GFlops は事実誤認どころか、近い数字でした。
TomOne
Re:んだかねぇ。 (スコア:0)
「荒し」にモデされている (#1134107 [srad.jp])を読んでみて。
これが「荒し」になるということが、今の日本のHPCの問題なんだから。
ベクタプロセッサは良くも悪くもメモリバンド幅が高いことで、
この結果として値段がむちゃくちゃ高いこと。
アプリケーションで如何にメモリバンド幅(さらにネットワークバンド幅)を
削減し演算器の性能を引き出すかが、現在の最大の課題なのに、
ベクタプロセッサが良いと主張することは、
この努力を行わないって言うことと同じことなんだ。
姫野ベンチは、メモリバンド幅ベンチマークとしては有効だけど、
最近では、演算性能を測るもの