Tianhe-1以外の中国スパコンのRmax/Rpeakを見ると、Top500ランキング19位のShanghai Supercomputer CenterのDawning 5000Aは77.35%、43位のComputer Network Information Center, Chinese Academy of ScienceのDeepComp 7000は70.43%ですし、Rmax/Rpeakだけ見れば203位のNanjing UniversityのIBM BladeCenterが91%が中国No.1なんですが、一切合切スルーして、効率の低さをノード数でカバー=「中国らしい人海戦術」で納得してしまいますか。恐れ入った強心臓ですね。 # 31位のESより下位のコンピュータはともかく、19位のDawning 5000Aをスルーとは知的誠実さ
何が目的なの? (スコア:0, フレームのもと)
期待する結果を得るのに必要な処理速度を満たしていれば、それ以上の性能は単なる無駄なコストです
私企業が勝手にやる分には構いませんが、税金使って遊んでるのかと思うと腹立たしいと思います
そもそも地球シミュレータは具体的に何の役に立ってるのでしょうか
これを言うとあーだこーだ言い出す人が出てくると思いますが、
言い換えれば「地球シミュレータが無いと何か困るのか」という事なんですが
#せっかく事業仕分けで削除対象になったのに、結局予算は付くみたいでガッカリですね
Re: (スコア:0, フレームのもと)
ここまで duenmynoth 氏の
「地球シミュレータが無いと何か困るのか」
に具体的に答えているのは
・地球シミュレータが無いと、局地的豪雨にいつまでも悩まされることになります。
・癌治療やインフルエンザウィルスの解析などにも使われています。
の二つだけ。
後は投げやりな「詳しく知りたければ こちらをどうぞ [jamstec.go.jp]」くらい。
まぁ気持ちは分からなくもないけど、例えば2009年の先頭に出てくる「AFESにおけるメキシコ湾流SST勾配に対する降水応答」 [jamstec.go.jp]。素人がこれを見て何が分かると思う? 回答としては不親切すぎるよ。(ちなみに「癌」や「インフルエンザ」で検索しても1件もヒットしない)
「自力で調べろ」という意見には同意するが、それにしてもだわ。
仕分人
Re: (スコア:0)
>ついでに個人的な疑問をひとつ。
>上の二つは地球シミュレータじゃないとダメなの?
>例えば「長崎大学のスーパーコンピュータ」では難しいことなの?
上の二つは「長崎大学のスーパーコンピュータ」でもかなり有望な種類の問題だと思います。
既存のもの(アルゴリズム、ソースコード)がそのまま使えるとは思えないので、たくさん研究開発をしないと実用レベルにはなれないと思いますが。
最近、「長崎大学のスーパーコンピュータ」を万能だと思っている人が多いんじゃないかという不安を持っている。あれは要するにGPUクラスタなので、ばかでかいメモリを必要とする問題とかはちょっと大変です。単純な並列処理ではうまくいかない問題の場合もよろしくありません。適材適所。
ちなみに、下火になってしまったベクトル計算機の知識・技術は今のマルチコア・メニーコア・GPUでも結構活用されているんじゃないかなぁと思うんですが、ベクトル計算機を語るには若すぎるのでごめんなさい。
色々とアレなのでAC。
Re: (スコア:1)
スーパーコンピュータをGPUクラスタで代替する場合、一番問題となるのは用途によっては演算精度が不十分なことでしょ。
うじゃうじゃ
Re: (スコア:4, 参考になる)
いえ、一番の問題はメモリ帯域です。
GPU のメモリアクセス速度は(キャッシュの関係で)遅く、さらに複数 GPU が連動する場合、PCI-e 経由でのデータ転送になるためここがものすごく足を引っ張ります(GPU-メインメモリ-GPU と転送する)。結果、効率が悪くなる。
いくら高出力のレース用エンジンを積んでも、ギア比が悪ければ速度は出ないでそ。
それぞれの計算ノードが完全独立して演算できるようなものならともかく、複雑に絡み合うタイプ(しかもこういうのは大抵メモリを馬鹿食いしている)の演算では、地球シミュレータの優位性はまだまだ揺るがないと言ったところでしょう。
-- To be sincere...
Re: (スコア:4, 参考になる)
あとまあメモリ帯域というか、メモリ量ですよね。GDDRじゃソケットにはできないだろうし、ローカルメモリ64GBとか無理だよねー、と。しょうがないからとPCIeで転送したらとろすぎて問題外だろうし。そこを何とかするのがソフトエンジニアの腕の見せ所ですが、たいていの研究者はソフト書くのが目的ではなく、研究するのが目的ですからね…
あとまあ話は違いますがIEEE754で積和演算の精度について標準化されたのはうれしいかぎり。
-- Takehiro TOMINAGA // may the source be with you!
Re: (スコア:1, 興味深い)
現在の中国最速(世界第5位)のスパコンは Xeon + Radeon HD4870x2 のクラスタですが、実効効率がすさまじく悪いです。
LINPACK の Rmax/Rpeak が 46% 台。地球シミュレータ(なにげに実効効率世界一)の半分程度の効率しかない。
何が理由って、
・GPU のメモリアクセスが遅い!(キャッシュ効かねー)
・メインメモリとのデータやりとりで、PCI-e が遅すぎる!!
らしいと。
中国らしい人海戦術だと妙に納得(w
-- To be sincere...
Re: (スコア:2, 興味深い)
Tianhe-1以外の中国スパコンのRmax/Rpeakを見ると、Top500ランキング19位のShanghai Supercomputer CenterのDawning 5000Aは77.35%、43位のComputer Network Information Center, Chinese Academy of ScienceのDeepComp 7000は70.43%ですし、Rmax/Rpeakだけ見れば203位のNanjing UniversityのIBM BladeCenterが91%が中国No.1なんですが、一切合切スルーして、効率の低さをノード数でカバー=「中国らしい人海戦術」で納得してしまいますか。恐れ入った強心臓ですね。
# 31位のESより下位のコンピュータはともかく、19位のDawning 5000Aをスルーとは知的誠実さ
Re: (スコア:1)
70%後半というのは、他のスカラ型クラスタでの平均レベルの性能です。(Jaguar も同レベル)
中国の他のもそういうタイプですね。5位のはそれとは違う、「GPU を使って演算性能を上げた」タイプです。
その代償として GPU のネックであるメモリの弊害がもろに出ているわけで。
そこら辺を無視して単純に Rpeak/Rmax を比べても意味がないって分かってます?
※同タイプであれば Rpeak/Rmax は、そのままチューニングの善し悪しに匹敵しますが
現状で読み取れるのは、GPU を使うタイプでは、これまで以上にメモリの使い方について注意を払ったチューニングを行わない限り、
-- To be sincere...
Re:何が目的なの? (スコア:1)
上記の点がご理解いただければ、Tianhe-1のLINPACKの結果からRmax/Rpeakの低さを論って「中国らしい人海戦術」などと揶揄することの馬鹿らしさは自ずとご理解いただけることと存じますが如何でしょう。
Re:何が目的なの? (スコア:1)
TSUBAMEねえ。
ClearSpeed って、GPU より多少はメモリが楽な程度(計192ノードに対してメモリ4GB)で、基本的に LINPACK の実効効率は悪い代物だってきちんと理解しなさいな。
それで 55% 台を出すために、チューニングを施していることも。ライブラリと LINPACK ベンチマークそのもののチューニングで、10TFlops の底上げを達成している、ってこともね。
この辺はそれこそ TSUBAME のオフィシャルページやらググれば分かることですけど。
Tianhe-1 が CPU 自体混載(Xeon の複数世代を利用)に GPU まで使って、それこそかき集める状態で作り上げられて、理論性能値で初の「米国外 1PFlops」を達成している点、実に人海戦術といってよいと思いますよ。
※性能の違うノードがあると、遅いノードに足を引っ張られる可能性がある
そのあたりも見ず、Top500 List だけ見ていることの馬鹿らしさは理解できますでしょうか?
-- To be sincere...