Tianhe-1以外の中国スパコンのRmax/Rpeakを見ると、Top500ランキング19位のShanghai Supercomputer CenterのDawning 5000Aは77.35%、43位のComputer Network Information Center, Chinese Academy of ScienceのDeepComp 7000は70.43%ですし、Rmax/Rpeakだけ見れば203位のNanjing UniversityのIBM BladeCenterが91%が中国No.1なんですが、一切合切スルーして、効率の低さをノード数でカバー=「中国らしい人海戦術」で納得してしまいますか。恐れ入った強心臓ですね。 # 31位のESより下位のコンピュータはともかく、19位のDawning 5000Aをスルーとは知的誠実さを疑います。
他国に目を転じてみると、22位のカナダのUniversity of TrontoのIBM DataPlexもなかなかイイ感じに低いのですが(55.09%)、これも中国の人海戦術ですね?そういえばカナダでは近年中国系の住民が増えているという話を小耳に挟んだのですが、こんな所に影響が現れていたとは驚くべきことです。 # インタコネクトがGbE?そんなの中国の人海戦術に較べれば些細なことです!
ところで「ESはRmax/Rpeakが93.38%!実行効率世界一ィィィィ!日本SUGEEEEE!!」って鼻高々なのは見てて微笑ましいんですが、2009年11月時点のRmax/Rpeakの世界一はESじゃなくてスイスUniversity of ZuerichのSun Blade(Top500ランキング96位)の96.25%ですね。続いてフランスのCentre Interuniversitaire de Calcul de ToulouseとONERAの2台のSGI Altix(それぞれ182, 223位)が94.66%の同率で2位・3位に入って、US Army Research Laboratory (ARL)のSGI Altix(72位)が93.9%で世界第4位と続きます。日本のES(31位)は93.38%で世界第5位です。
もっとも1~4位のスパコンは絶対性能でESの敵じゃありませんが。問題はその下。
93.3%で第6位のBrigham Young UniversityのDell PowerEdgeのクラスタはTop500ランキング278位ですが、第7位のアメリカERDC DSRCのSGI Altixは無視するわけにはいきません。Rmax/RpeakこそわずかにESに及ばない(93.12%)ものの、Top500ランキングは24位でRmax, RpeakともESよりだいぶ上です。実行効率を振りかざして喜んでばかりもいられませんね。
何が目的なの? (スコア:0, フレームのもと)
期待する結果を得るのに必要な処理速度を満たしていれば、それ以上の性能は単なる無駄なコストです
私企業が勝手にやる分には構いませんが、税金使って遊んでるのかと思うと腹立たしいと思います
そもそも地球シミュレータは具体的に何の役に立ってるのでしょうか
これを言うとあーだこーだ言い出す人が出てくると思いますが、
言い換えれば「地球シミュレータが無いと何か困るのか」という事なんですが
#せっかく事業仕分けで削除対象になったのに、結局予算は付くみたいでガッカリですね
Re: (スコア:0, フレームのもと)
ここまで duenmynoth 氏の
「地球シミュレータが無いと何か困るのか」
に具体的に答えているのは
・地球シミュレータが無いと、局地的豪雨にいつまでも悩まされることになります。
・癌治療やインフルエンザウィルスの解析などにも使われています。
の二つだけ。
後は投げやりな「詳しく知りたければ こちらをどうぞ [jamstec.go.jp]」くらい。
まぁ気持ちは分からなくもないけど、例えば2009年の先頭に出てくる「AFESにおけるメキシコ湾流SST勾配に対する降水応答」 [jamstec.go.jp]。素人がこれを見て何が分かると思う? 回答としては不親切すぎるよ。(ちなみに「癌」や「インフルエンザ」で検索しても1件もヒットしない)
「自力で調べろ」という意見には同意するが、それにしてもだわ。
仕分人
Re: (スコア:0)
>ついでに個人的な疑問をひとつ。
>上の二つは地球シミュレータじゃないとダメなの?
>例えば「長崎大学のスーパーコンピュータ」では難しいことなの?
上の二つは「長崎大学のスーパーコンピュータ」でもかなり有望な種類の問題だと思います。
既存のもの(アルゴリズム、ソースコード)がそのまま使えるとは思えないので、たくさん研究開発をしないと実用レベルにはなれないと思いますが。
最近、「長崎大学のスーパーコンピュータ」を万能だと思っている人が多いんじゃないかという不安を持っている。あれは要するにGPUクラスタなので、ばかでかいメモリを必要とする問題とかはちょっと大変です。単純な並列処理ではうまくいかない問題の場合もよろしくありません。適材適所。
ちなみに、下火になってしまったベクトル計算機の知識・技術は今のマルチコア・メニーコア・GPUでも結構活用されているんじゃないかなぁと思うんですが、ベクトル計算機を語るには若すぎるのでごめんなさい。
色々とアレなのでAC。
Re: (スコア:1)
スーパーコンピュータをGPUクラスタで代替する場合、一番問題となるのは用途によっては演算精度が不十分なことでしょ。
うじゃうじゃ
Re:何が目的なの? (スコア:4, 参考になる)
いえ、一番の問題はメモリ帯域です。
GPU のメモリアクセス速度は(キャッシュの関係で)遅く、さらに複数 GPU が連動する場合、PCI-e 経由でのデータ転送になるためここがものすごく足を引っ張ります(GPU-メインメモリ-GPU と転送する)。結果、効率が悪くなる。
いくら高出力のレース用エンジンを積んでも、ギア比が悪ければ速度は出ないでそ。
それぞれの計算ノードが完全独立して演算できるようなものならともかく、複雑に絡み合うタイプ(しかもこういうのは大抵メモリを馬鹿食いしている)の演算では、地球シミュレータの優位性はまだまだ揺るがないと言ったところでしょう。
-- To be sincere...
Re:何が目的なの? (スコア:4, 参考になる)
あとまあメモリ帯域というか、メモリ量ですよね。GDDRじゃソケットにはできないだろうし、ローカルメモリ64GBとか無理だよねー、と。しょうがないからとPCIeで転送したらとろすぎて問題外だろうし。そこを何とかするのがソフトエンジニアの腕の見せ所ですが、たいていの研究者はソフト書くのが目的ではなく、研究するのが目的ですからね…
あとまあ話は違いますがIEEE754で積和演算の精度について標準化されたのはうれしいかぎり。
-- Takehiro TOMINAGA // may the source be with you!
Re:何が目的なの? (スコア:1, 興味深い)
現在の中国最速(世界第5位)のスパコンは Xeon + Radeon HD4870x2 のクラスタですが、実効効率がすさまじく悪いです。
LINPACK の Rmax/Rpeak が 46% 台。地球シミュレータ(なにげに実効効率世界一)の半分程度の効率しかない。
何が理由って、
・GPU のメモリアクセスが遅い!(キャッシュ効かねー)
・メインメモリとのデータやりとりで、PCI-e が遅すぎる!!
らしいと。
中国らしい人海戦術だと妙に納得(w
-- To be sincere...
Re: (スコア:0)
> LINPACK の Rmax/Rpeak が 46% 台。地球シミュレータ(なにげに実効効率世界一)の半分程度の効率しかない。
あれは、CPU+GPUのへテロクラスタとしては驚異的に効率が良いという評判ですけどね(笑)。中国人やるなあ。
Re:何が目的なの? (スコア:2, 興味深い)
Tianhe-1以外の中国スパコンのRmax/Rpeakを見ると、Top500ランキング19位のShanghai Supercomputer CenterのDawning 5000Aは77.35%、43位のComputer Network Information Center, Chinese Academy of ScienceのDeepComp 7000は70.43%ですし、Rmax/Rpeakだけ見れば203位のNanjing UniversityのIBM BladeCenterが91%が中国No.1なんですが、一切合切スルーして、効率の低さをノード数でカバー=「中国らしい人海戦術」で納得してしまいますか。恐れ入った強心臓ですね。
# 31位のESより下位のコンピュータはともかく、19位のDawning 5000Aをスルーとは知的誠実さを疑います。
他国に目を転じてみると、22位のカナダのUniversity of TrontoのIBM DataPlexもなかなかイイ感じに低いのですが(55.09%)、これも中国の人海戦術ですね?そういえばカナダでは近年中国系の住民が増えているという話を小耳に挟んだのですが、こんな所に影響が現れていたとは驚くべきことです。
# インタコネクトがGbE?そんなの中国の人海戦術に較べれば些細なことです!
56位には東工大のTSUBAMEが入ってますけど、これはOpteronなSun FireにnVidia Tesla(GPGPU)とClearSpeed CSX600(分子動力学計算用アクセラレータボード)を挿して53.32%。GPGPUも使っちゃうし、中国の人海戦術は一目瞭然です。
そして極めつけは445位、日本の東大・国立天文台のGRAPE-DR!なんとRmax/Rpeakは25.99%!!Tianhe-1の46%なんか目じゃありません。おそるべし中国の人海戦術!
ところで「ESはRmax/Rpeakが93.38%!実行効率世界一ィィィィ!日本SUGEEEEE!!」って鼻高々なのは見てて微笑ましいんですが、2009年11月時点のRmax/Rpeakの世界一はESじゃなくてスイスUniversity of ZuerichのSun Blade(Top500ランキング96位)の96.25%ですね。続いてフランスのCentre Interuniversitaire de Calcul de ToulouseとONERAの2台のSGI Altix(それぞれ182, 223位)が94.66%の同率で2位・3位に入って、US Army Research Laboratory (ARL)のSGI Altix(72位)が93.9%で世界第4位と続きます。日本のES(31位)は93.38%で世界第5位です。
もっとも1~4位のスパコンは絶対性能でESの敵じゃありませんが。問題はその下。
93.3%で第6位のBrigham Young UniversityのDell PowerEdgeのクラスタはTop500ランキング278位ですが、第7位のアメリカERDC DSRCのSGI Altixは無視するわけにはいきません。Rmax/RpeakこそわずかにESに及ばない(93.12%)ものの、Top500ランキングは24位でRmax, RpeakともESよりだいぶ上です。実行効率を振りかざして喜んでばかりもいられませんね。
Top500のExcelシート落として、Oooで開いて、Rmax/Rpeakを計算してオートフィルタをかけて眺めただけでこれくらいのことはたちどころに分かるんですけど?
Re: (スコア:0)
あなたの場合は見えなくなっているものが多すぎますよ(笑)
Re:何が目的なの? (スコア:1)
70%後半というのは、他のスカラ型クラスタでの平均レベルの性能です。(Jaguar も同レベル)
中国の他のもそういうタイプですね。5位のはそれとは違う、「GPU を使って演算性能を上げた」タイプです。
その代償として GPU のネックであるメモリの弊害がもろに出ているわけで。
そこら辺を無視して単純に Rpeak/Rmax を比べても意味がないって分かってます?
※同タイプであれば Rpeak/Rmax は、そのままチューニングの善し悪しに匹敵しますが
現状で読み取れるのは、GPU を使うタイプでは、これまで以上にメモリの使い方について注意を払ったチューニングを行わない限り、性能を十全に発揮できないと言うことです。
ついでに言えば LINPACK は GRAPE-DR にとっては「非常に苦手」ですし、地球シミュレータにとっても、「実は不得手」であることも理解してます? GRAPE-DR で LINPACK のスコアが悪くても、そもそも GRAPE-DR は特定目的特化型(重力多体問題の粒子相互作用演算専用ハードウェアが元)なので、これで LINPACK やること自体ある意味「無駄」なのですが。
24位を無視できない? コア数は比較しましたか? コア数で12倍だけど、Rpeak も Rmax もせいぜい3割弱しか違いませんが。というか、Top500 中もっとも少ないコア数ですけどね、ES。
-- To be sincere...
Re: (スコア:0)
君は、というかここにいる全員だろうが、Rmaxの意味をわかっていないね。
あれはa good correction of peak performanceにすぎない。
どうせtop500.orgの文書をまともに読んだことなんて一度もないんだろ?
Re:何が目的なの? (スコア:1)
ご指摘のとおりですが、何か問題がありますか?
俺はTianhe-1のRmax/Rpeakの低さを論って「中国らしい人海戦術」などと揶揄した誰かさんのマネをしただけですので、Rmax/Rpeakの文句はそちらにどうぞ。
Re:何が目的なの? (スコア:1)
上記の点がご理解いただければ、Tianhe-1のLINPACKの結果からRmax/Rpeakの低さを論って「中国らしい人海戦術」などと揶揄することの馬鹿らしさは自ずとご理解いただけることと存じますが如何でしょう。
Re: (スコア:0)
3つも4つも糞記事を書き連ねる前にきちんとtop500.orgの文書を読んでください。
そうすれば元の糞記事への反論をするにしても、あんたが今やっているのは同レベルの糞だということが自覚できるようになるでしょう。
迷惑度では、あんたのほうがずっと大きいんだよ。
Re:何が目的なの? (スコア:1)
> そうすれば元の糞記事への反論をするにしても、あんたが今やっているのは同レベルの糞だということが自覚できるようになるでしょう。
ご忠告は千万ありがたく存じますが、top500の文章なんか読むまでもなく、同レベルは百も承知でやってますからほっといてくださいな。
そもそもあなたの「お前Rmaxの意味知らないな?」が元のクソなコメントに対するツッコミだったら俺ぁスルーしてましたけど?
議論の流れを無視してコメントに見当違いのツッコミ入れるのも十分すぎる迷惑行為ですので、以後慎んでいただけると助かります。
Re: (スコア:0)
そうもいけませんね。
あなたの元ネタに対する反論は、ぜんぜん反論になっていません。むしろありもしない敵に噛み付いている。
top500.orgの文書にいろいろ書いてありますから、読めばなぜなのが理解できるはずです。(長いので引用できません)
今やあなたのまき散らす糞コメントは、元のに比べてはるかに有害です。元コメはレッテル貼りをしたにすぎないですからね。それもあながち外れというわけではないかもしれない。
元コメに反論するのは結構ですが、数字を並べてそれらしく装った嘘や誤解をまき散らすようなことのほうがよほど迷惑です。
> 議論の流れを無視してコメントに見当違いのツッコミ入れるのも十分すぎる迷惑行為ですので、以後慎んでいただけると助かります。
いまスレッドを荒らしている人間はあなたです。事実を指摘して荒しをたしなめることが迷惑行為ですか。一体どれだけオレ様思考なんだよ(笑)
Re:何が目的なの? (スコア:1)
野暮だから書かずにおこうと思ってたんですが、横合いからしつこく絡まれては始末に負えないから種明かし(自コメ解説)をしましょうか。
俺は、Rmax/Rpeakという指標でスパコンの効率を評価するという「heavensgateの土俵」に敢えて上がった上で、彼がTianhe-1を「中国らしい人海戦術」と評価したり、地球シミュレータを「なにげに実効効率世界一」と評価することに、反例を挙げて反論しているんです。断っとかないと誤解する人がいるから断っときますが、俺が反例を挙げるのはRmax/Rpeakを指標としてESやTianhe-1に評価を下すことに対する反論のためで、実際の各々のスパコンの実行効率がどのように評価されているかとは関係ないレイヤで話をしてるってことに注意してくださいね。
そういう目的があって、中国のスパコンにもRmax/Rpeakが70%を超えるものがあると指摘したり、カナダのスパコンや国産のTSUBAMEやGRAPE-DRのRmax/Rpeakの小ささを「中国らしい人海戦術」と揶揄したり、Rmax/RpeakがESより高いスパコンなどを挙げてみたわけです。この反論が実態と乖離した詭弁やトンデモであることは百も承知。そうなることを狙って書いてるんですから。
heavensgateがこのトンデモ反論に対して、70%なんてスカラ型なら並だとかGPGPUクラスタはLINPACKで性能が出るアーキテクチャじゃないとかの「正論」で反論すると、それは自動的にRmax/Rpeakという指標を持ち出したことや、それに依って下した「中国らしい人海戦術」というTianhe-1の評価に対する反論にもなるってカラクリです。早い話が背理法。
上記のような段取りで議論を展開していく上で、RmaxやRpeakが何を意味する値で、その比の値を使ってスパコンの効率を評価することが妥当かそうでないかが問題になるかというと、ならない。したがってそれに対して「Rmaxの意味をわかっていないね」というコメントが付くこと自体が「汚れ」「荒らし」なんですよ。だから言ったでしょ、heavensgateの親コメへのレスとして書かれていたらこっちだってコメントなんかしなかったって。
そもそもRmaxやRpeakがどのような値であるにしても、割り算は意味がないとか、比の値をパーセントで表すなとか、アーキテクチャの異なるスパコンのあいだで比較できるものじゃないとか、値が大きければ効率がいいってわけじゃないとか、この値だけで効率を評価することは不可能だから比較なんて無意味だとか、そういうレベルの指摘ができないとは思えないのですが?
> 数字を並べてそれらしく装った嘘や誤解をまき散らす
アレが「それらしく装った」ように見えますか。あからさまにトンデモだと面白味に欠けるからある程度は「それらしく装った」けど、分子動力学の計算に特化した計算機であるGRAPE-DRのLINPACKの結果を論ってdisったり、カナダのスパコンにおける中国の人海戦術の影響を指摘してみたり、わかりやすい詭弁やトンデモを一生懸命仕込んだつもりだったんですけど、努力が報われなかったようで残念です。
Re: (スコア:0)
#1691461
tt> あとまあメモリ帯域というか、メモリ量ですよね。GDDRじゃソケットにはできないだろうし、ローカルメモリ64GBとか無理だよねー、と。しょうがないからとPCIeで転送したらとろすぎて問題外だろうし。そこを何とかするのがソフトエンジニアの腕の見せ所ですが、たいていの研究者はソフト書くのが目的ではなく、研究するのが目的ですからね…
#1691562
heavensgate> 中国らしい人海戦術だと妙に納得(w
#1691571
AC> あれは、CPU+GPUのへテロクラスタとしては驚異的に効率が良いという評判で
Re: (スコア:0)
ネタにマジレス…って書こうとしたらネタのつもりだったのか…
全然笑えなかったけど。
Re: (スコア:0)
> 効率の低さをノード数でカバー=「中国らしい人海戦術」で納得してしまいますか。恐れ入った強心臓ですね。
tuneo氏が「人海戦術」と「物量作戦」の区別がついていなくて、それでheavensgate氏に意味不明な絡み方をしてたんだ(笑)
まさかそんなア○だったとは…。
Re:何が目的なの? (スコア:1)
TSUBAMEねえ。
ClearSpeed って、GPU より多少はメモリが楽な程度(計192ノードに対してメモリ4GB)で、基本的に LINPACK の実効効率は悪い代物だってきちんと理解しなさいな。
それで 55% 台を出すために、チューニングを施していることも。ライブラリと LINPACK ベンチマークそのもののチューニングで、10TFlops の底上げを達成している、ってこともね。
この辺はそれこそ TSUBAME のオフィシャルページやらググれば分かることですけど。
Tianhe-1 が CPU 自体混載(Xeon の複数世代を利用)に GPU まで使って、それこそかき集める状態で作り上げられて、理論性能値で初の「米国外 1PFlops」を達成している点、実に人海戦術といってよいと思いますよ。
※性能の違うノードがあると、遅いノードに足を引っ張られる可能性がある
そのあたりも見ず、Top500 List だけ見ていることの馬鹿らしさは理解できますでしょうか?
-- To be sincere...
Re: (スコア:0)
Re: (スコア:0)
学会とかでもこれくらいの議論が常に飛び交うようになればいいのにねと思う修士学生がここに一匹w
Re:何が目的なの? (スコア:1)
今更亀な事ですが、日経エレクトロニクス 2009-12-28 号に出島クラスタの
事が出てました。
なんでも、GPU を使っているために演算エラーが出まくりで、
実行演算速度は 1/10。1000万円/TFLOPS 近く、すなわち一般的な
スパコンと同レベルまで価格性能比が落ちてしまうそうです。
TomOne