アカウント名:
パスワード:
これ、LINPACK専用なんでしょうか?
http://pc.watch.impress.co.jp/docs/news/1006258.html [impress.co.jp]ピークの演算性能が京の10倍あるのに、メモリ容量は京が1.4PB、神威は1.3PBと同程度。演算性能に対するメモり帯域は、京が0.5B/FLOP、神威は記事通りなら0.05B/FLOPと1/10程度しかない。ここ数年のTOPに近いスパコンは、0.2~0.5B/FLOPぐらいの帯域は維持してるのですが、神威はどう考えても低すぎ。その上キャッシュがほとんど無いと来ると、メモリ負荷が軽いLINPACKでは性能が出せても、実アプリでは壊滅的になりそう。
それでも、自国でこれだけのプロセッサを開発できて、これだけの規模のスパコンを作れるのは素直に凄いと思う。
たとえば、nVidiaのTesla M40なんかは7TFlopsにたいして288MB/sなので、0.04B/Flops。そういう方向の(GPU的な)プロセッサなんでないの。
Tesla M40が7TFLOPSあるのは単精度で、倍精度は0.2TFLOPSしかないので、1.3B/FLOPぐらいありますよ。MaxwellアーキテクチャのM40は、倍精度の演算器を削っていてスパコン用ではないですが。普通は倍精度が必要なスパコン用にはKepler世代を使うので、こちらで計算すると、0.2B/FLOPぐらい。最新のPascal使ったスパコンはまだ出ていませんが、こちらで計算すると、0.15B/FLOPぐらい。
M40が速いのは単精度だけだよ。TOP500で使ってるLINPACKは倍精度の話で、それだとM40は精々0.2TFLOPS位。だいたい1B/FLOP。
M40はそもそも単精度計算用って事でこうなってるけど、倍精度計算で0.05B/FLOPってどうなんて話だと思う。
こいつはエンドツーエンドの演習なんだろうな。次が怖い。
LINLACK専用、かつ機器最適化に数か月かけてるとかいう噂
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall
LINPACK専用? (スコア:4, 興味深い)
これ、LINPACK専用なんでしょうか?
http://pc.watch.impress.co.jp/docs/news/1006258.html [impress.co.jp]
ピークの演算性能が京の10倍あるのに、メモリ容量は京が1.4PB、神威は1.3PBと同程度。
演算性能に対するメモり帯域は、京が0.5B/FLOP、神威は記事通りなら0.05B/FLOPと1/10程度しかない。
ここ数年のTOPに近いスパコンは、0.2~0.5B/FLOPぐらいの帯域は維持してるのですが、神威はどう考えても低すぎ。
その上キャッシュがほとんど無いと来ると、メモリ負荷が軽いLINPACKでは性能が出せても、実アプリでは壊滅的になりそう。
それでも、自国でこれだけのプロセッサを開発できて、これだけの規模のスパコンを作れるのは素直に凄いと思う。
Re:LINPACK専用? (スコア:2)
たとえば、nVidiaのTesla M40なんかは7TFlopsにたいして288MB/sなので、0.04B/Flops。そういう方向の(GPU的な)プロセッサなんでないの。
Re: (スコア:0)
Tesla M40が7TFLOPSあるのは単精度で、倍精度は0.2TFLOPSしかないので、1.3B/FLOPぐらいありますよ。
MaxwellアーキテクチャのM40は、倍精度の演算器を削っていてスパコン用ではないですが。
普通は倍精度が必要なスパコン用にはKepler世代を使うので、こちらで計算すると、0.2B/FLOPぐらい。
最新のPascal使ったスパコンはまだ出ていませんが、こちらで計算すると、0.15B/FLOPぐらい。
Re: (スコア:0)
M40が速いのは単精度だけだよ。
TOP500で使ってるLINPACKは倍精度の話で、それだとM40は精々0.2TFLOPS位。だいたい1B/FLOP。
M40はそもそも単精度計算用って事でこうなってるけど、倍精度計算で0.05B/FLOPってどうなんて話だと思う。
Re: (スコア:0)
こいつはエンドツーエンドの演習なんだろうな。次が怖い。
Re: (スコア:0)
LINLACK専用、かつ機器最適化に数か月かけてるとかいう噂