アカウント名:
パスワード:
答えた人間が間抜けだったってだけのことでは。むしろ仕分け人の方がスパコン開発の意義を理解してたんじゃないかな。
それは即ち、そんな答えをする人間を連れてきた文部科学省が間抜けだって事だ。
質問内容なんぞ7月の国会での質疑の時の話そのままじゃないか。仕分け人はちゃんとその時の流れを以って質問していた。しかし相手はその時の質問の答えすら用意していないとは思わなかったろう。
「きちっと説明されていれば、こういう結論にはならない」という枝野氏の発言の表だけを見て揶揄する奴等は多いが、ちょっと違うよね。「宿題に答えて具体的に説明を行えば、ある程度救ってやるお膳立てはしたのに」って意味に取るべきだろ。蓮舫氏の2位云々の話も「2位以下の結果となっても意義はある」という話の呼び水としてわざわざ用意したのに回答者が無視しただけだし。
事業仕分けのスパコン(スカラー)と今回のスパコン(GPU)はまったく別物。地球シミュレータ(ベクトル)も。
GPUを用いた今回のやつは、例えば100個の足し算や引き算をまとめて一回とかでしちゃうので、スカラー型のスパコンに比べれば単純な性能は100倍とかになったりします。なので単体あたりの性能も500GFlopsとかって言われているけど、実際の科学技術計算とかではそんなに単純な計算ばかりだけではなく、
(A*((B+C)-D)*cos(E)-F)/G
何て計算式があったときには、まずB+Cをし、次にAを掛けて・・・と1つずつしないとなると、GPUでは極端にスピードが落ちる。
しかし、スカラー型は単純な足し算引き残だけではなく難しいアルゴリズムを用いた複雑な計算式を一回で解けるようにしていたり、複素数が使えたりとか小数点とか計算精度も高かったりします。
GPUが得意なモニタは点の集まりで構成されており、3次元でこの部分が影になるから黒に近づけるとか、透明化しているように見えるために色を組み合わせるとか、の点々の計算が大量にあるから、そういう処理はGPUが得意。
今のPCに乗っかっているCPUもネットしながら動画を見たり、音楽聞いたりと様々な計算をする必要があり、スカラー型です。曲を同じタイミングで100曲ながしたりとかしないよね??
地球シミュレータのベクトル型もGPUと同じような動作を行いますが、地球を1km四方とかで区切って、同じような計算をいっぱいするから。
地球シミュレータがGPUと違ってすごいのは、GPUは1個の数字が8桁までとかだけど、地球シミュレータは32桁まで大丈夫とかってなるわけです。8桁までの計算をするんだったら、GPUでもいいけど、32桁の計算をするんだったら、地球シミュレータしか無理となる。
なんで、GPUは何で32桁にしないかというと、GPUとして使っているから、必要ないのです。通常の液晶ディスプレイは1677万色しか生成できず、1000億色まで生成できるといっても人間に判断できないので、作る必要が無いし、作ったら当然コストも高いし、電力も食う。
もっと言うとでかい数字を大量にするとなったときに、メモリからCPUにデータを大量に送る必要がでてきて、GPU用のGDDR5なんていうグラフィックに最適化したDDRメモリを乗っけていますが、それでも速度的には限界。ベクトル型CPUにはもっと専門的なメモリからの転送手法が必要になってきます。しかし、そのような手法はとても難しく、地球シミュレータが最後のベクトル型でトレンドとしては今はスカラー型が多くなってきている。でも、地球をシミュレーションするような気象関係の計算には、今でもベクトル型の方が有利。
一般にも使われているGPUを使っている今回のやつは当然値段も安い。
>非常に狭い
こういう馬鹿文系的な表現でなく、データ(有効制度の範囲など)を示していただくと、コメントの説得力が増しますよ。
GPUで高速計算出来るのは単精度(32bit)多くの科学技術計算で使われているのは倍精度(64bit)
ちなみに、おいらがプログラミングしている処理も単精度だとまったく桁数が足らないのでこの意見に同意。
しかもちょっと前までIEEE 754な浮動小数点演算ですらなかったりするので要注意でした。
# まぁ、描画用演算に人間の目が識別出来ないような精度や丸め方はそんなに重要じゃなかったろうしねぇ
下の方 [srad.jp]でも指摘されているとおり、今時のGPUは倍精度でもなかなかの速度を出しますよ。NVIDIAの次世代GPU (Fermi) は、明らかに倍精度での性能を重視した作りになっています。
GPUを利用したのは確かに安くて速いんだけど精度の問題で利用できる範囲は非常に狭いです。
つまり、浮動小数点演算部分を 32bit から 128bit に増強した GPU を nVIDIA に大量生産してもらえばいいって事ですな。
…っていうか、地球シミュレーターってベクトル型なんだから、あいつの中に入っているベクトル演算部の設計を一部流用して、GPUを作ればいいんじゃないか? > NEC
PC用になるかどうかはともかく、映画とかの高精細画像を必要とするエリアには使えるだろう。ハリウッドとかも大量購入しそうな気がするぞ?
で、そうやって大量に出来たGPUの在庫を使ってスパコンを作る…なぁ、2012年までに間に合うような、嫌な予感がしないか?
いやそれやったらこんなに安くなんないから。 これはあくまで大衆向けのチップを流用してるから価格性能比が高いってだけで。
いやそれやったらこんなに安くなんないから。
国や地方が買うPCの購入用件にこのGPUの利用を追加して、その分の予算として京速スパコンの予算を割り振れば、量産効果ぐらいあっという間に …
>> 国や地方が買うPCの購入用件にこのGPUの利用を追加して、その分の予算として京速スパコンの予算を割り振
そんな努力をしたところで,全世界のPC市場の規模を考えたら誤差みたいなレベルでは?要はマーケットがそういう機能や性能を欲しているかどうかという問題でしょう.
しかも上記説明の前半部も後半部も結局は税金投入というあたり,「財源なんか気にしないで税金はジャンジャン使いましょう」という発想ですか?
そんな努力をしたところで,全世界のPC市場の規模を考えたら誤差みたいなレベルでは?
nVIDIAの3Dチップが搭載されているPCなんぞ、全世界のPC市場の規模から考えたら誤差にすらならないレベルです。大丈夫。PCサーバーという巨大なマーケットのほとんどで、GPUは不要とされている、という事実を考慮しよう。
実際問題、GPUがもっと汎用性のあるビット長になってくれると、暗号/復号周りの処理なんかがGPU任せにできるようになり、利便性は向上します。そうすると、今まで存在しなかった「サーバ市場」と言うものが開ける。で、結果として台数も売れる。当然スケールメリットはでまくります。
NECとしては、「 インテルとNEC、将来に向けたスーパーコンピューター技術の共同開発に合意 [nec.co.jp]」の枠組みでやるみたい。
ベンチマーク厨にとってはトップスピードが最重要で、精度や信頼性は三の次なんですよ。
>地球コンピュータ
そう言ってる本人の方がより馬鹿に見えてしまうと話が続かないので、他人を馬鹿呼ばわりするときは用語や言葉遣いに注意した方が良いです。
>精度の問題で利用できる範囲は非常に狭いです。
倍精度の演算器では足りないの?四倍精度などのそれ以上をソフトウェア的にやっても駄目?
今のGPGPUだと、最近出た新しいやつでピーク性能は倍精度で500GFLOPSぐらい。その前の世代でも250GFLOPSぐらい。倍精度でよければ数百基積めばそれなりの速度は出ると思うけど?#ソフトウェア側の工夫がいるとか、分割できる問題でないとというのは当然だけれども。
GPUは、速度は滅茶苦茶速いですけど、メモリが少ないので、性能を引き出すのがすごく難しいんですよ。以前書いたコメントからのコピペ [srad.jp]なので、1年以上前の情報ですが、
姫野ベンチのCUDA最適化という例を挙げられてたんですが、CPUだけだとは実測1GFlopsぐらいなんですが、理論値600GFlopsのGPU4枚で、実測50GFlopsぐらい出せたとか。コアはたったの2%しか働いてない
って感じ。それでも、GPUは単価が安いので数で攻めることができるわけですが、プログラミングの難易度は格段に高いと思います。ちょっとした違いで速度が大幅に変わってきます。
今回の事例では、768GPUみたいですが、1GPUが1TFlopsとしても、ピーク768TFlopsで、実効158TFlopsと、20%もの性能を引き出してることになります。
GPGPUでこれだけ性能を出せたのは、「扱っている多体問題がGPGPU向けだった」ってことと「プログラマが凄く頑張った」ってことは言えると思います。このコンピュータが、「どんな問題でもそれだけの性能が出せる」って考えてはダメでしょう。
本研究においては、長崎大学に構築した大規模なGPUクラスタを利用し、その上に天文学向けにはツリー法、 流体計算では高速多重極法と呼ばれる手法を実装しました。これらは実用的に用いられている高速な計算手法ですが、 その反面複雑で並列化がしにくく、GPUによる並列化が難しかった手法です。 しかし、新しく開発した「マルチウォーク法」により効率の良い並列化を可能とし、高い効率を得ることに成功しました。
とのことで、プログラマが凄く優秀かつ凄く頑張って 扱っている多体問題をGPGPU向けのアルゴリズムで解けるようにした、ではないでしょうか。 GPGPUでのプログラミング能力と、GPGPU向きのアルゴリズムを考案する能力が揃わなければ これだけの成果は出なかったと思います。 新しいアルゴリズムの開発が出来る問題ばかりではないでしょうし、出来るような人材がごろごろいるわけでもないでしょうから 大規模な次世代スパコンの開発も行うべきだと思いますが、こういった人材を育てる方面にももっと予算を出して欲しいです。 上手く育ってくれない例のほうが多いかもしれませんが、上手くいくと初めから分かっていれば 国が予算を出さなくとも、余裕のある企業が手を出すでしょうし・・・ # HTMLのプレスリリースの一部がダブっているのは、大事なことなので二回言いました?
>って感じ。それでも、GPUは単価が安いので数で攻めることができるわけですが、プログラミングの難易度は格段に高いと思います。>ちょっとした違いで速度が大幅に変わってきます。
それはそうなんだけど、元々日本がやってたベクトルコンピュータもそれは基本的に同じ問題を抱えてた訳で。力技のスカラー&超並列が主流なのも、そこら辺をカバーして余りある汎用性と、単体で足りないところは数でカバーが出来るほどの低コスト(比較)にある訳ですからねぇ。
それはともかく、今回の受賞もH/Wに対してではなく問題解決のソフトウェア部分に対してでしょう? スラドでもなにやらH/Wの話ばかりでそこがあまり取り上げられないのはなんだかな。京速計算機プロジェクトに今一支持したい気になれないのは、結局はH/Wに偏重しすぎている従来型ハコモノ土建型公共事業の匂いが強すぎて、ソフトウェアやサービスのコストを評価しないところですね。
>性能を引き出すのがすごく難しいんですよ。
ああ、それは承知しているのですが、元コメの方が「精度の問題で」と書いてあったことに疑問を持ったもので。#昔の単精度しかできないGPGPUならともかく、最近の倍精度もできるやつならそんなに問題にならんのじゃないかなあと。
>GPUは、速度は滅茶苦茶速いですけど、メモリが少ないので、性能を引き出すのがすごく難しいんですよ。
なのでnVidiaの次期GPU Fermiでは内部メモリが増え、より汎用計算向けになりました(3DCG描画はその一環) [impress.co.jp]。
そういう性能って、本来のGPUの役割として必要なんだろうか。倍精度計算も含めて
グラフィック描画のついでで計算するならともかく、計算目当ての設計になってくるとだんだん一般人向けじゃなくなりコストが上がってくるような……
2位のCELLを使った奴が75%だそうで、この差はローカルメモリと推測されてますのですでにコメントされてますが、ローカルメモリとして固定できるキャッシュを搭載したFermiならもう少しいけそうですね。
もちろんメモリ帯域にだけスケーリングするようなプログラムならベクトル機最強ですけど。
こういう反論しかできなきゃ、そりゃ文系にバカにされるよなぁ。いや、文系だけなのか!?
スーパーコンのユーザーやその関係者の皆様によってなんとか復活への希望の光が見えてきたけど、ユーザーだってダメ開発者の尻拭いをいつまでもできる訳じゃないんだよ。
いわゆる理系の人たちからどう見られているか、スーパーコン開発者とその周りの人はもっと世間に目を向けるべき。
そんなのはソフトでカバーすれば良い。それでパフォーマンスが落ちるのなら、今度は台数でカバーすれば良い。なんたって、コストパフォーマンスが10倍以上違う物だから。
そして複数台あれば必要時以外は分割して広く利用が出来るという、一点豪華主義には無い利点も出る。
富士通の社外デザインベースのスカラーオンリーマシンを作っても、技術的蓄積って点じゃ富士通の経験値にしかならん。それも既に他社が成し遂げているスキルに付いての物だけ。
日立やNECが抜けたのは「開発」でなく「構築」って面が高く、持ち出しコストの割には見返りが無いって判断な訳だし。
富士通の社外デザインベースのスカラーオンリーマシンを作っても、
ってーのが何を指してるのか今一よくは分かりませんが。
あそこのスパコン用のアーキのフロントエンドをSPARCに挿げ替えたものがSPARC64なんですが。それでも「社外デザインベース」なんですかね?スカラーオンリーいってるけど、VenusはSIMD拡張を行ってますけど。
「デザイン」ってのはISAの設計のこと。SIMD拡張しても「スカラーオンリー」ってを言うんだったら、IntelだってAMDだって「社外デザインベースのスカラーオンリー」のプロセッサを作ってるってことになりますねw
台数が増えると、故障率というか信頼性の問題が。
最近はメモリエラーが多い……
> ここも馬鹿文系ばっかりか> 2chのニュー速あたりと変わらないのかスラドも…
自己紹介ですか?
なんだ下手なODAより安いのか総理の母親にもらえよ
F1なんて2400ccだけど、トヨタのエスティマ(2400ccの)と同じですよ?
F1カーと比較するなら、WRCカーにしときなさい。サーキットならF1カー、グラベルや雪上ならWRCカーが速い。
#つまり、別種のものを比べる愚を冒してないか?の視点が必要。
別種のものを比べること自体は愚かではない。愚かなのは、用途や使用条件の違うものを、ある一つの指標をもって、要・不要を語ること。
>そして今回は、2000ccのエンジンで300馬力出しました>ってところじゃないかな。
車で例えるなら、ピーキー過ぎて使えないとか、燃料効率が悪すぎるというのもありそうだな。
NECと日立が抜けて単なるスカラ型になった時点で、RoadRunnerやJaggerと同じ土俵上での単なる馬力競争という状況になってるから、少なくとも飛行機と戦車ほどの違いはない。高出力のガスタービンエンジン&口径のでかい主砲を備えた戦車を今から開発して配備するか、レシプロエンジン搭載の既存の戦車のエンジンや主砲をちょっとチューンして大量配備するか、という程度の違い。
ただし、仮想敵(=その戦車が必要な理由)は明確になっていない、ということころかな。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy
たしかに (スコア:0)
地球シミュレータの開発が凍結されてもしかたありませんよね。
国の政策でなく、大学の研究レベルで高スペックのものが出来るようになったというのは
GPUメーカーのおかげではあるけれど、正しい研究開発の姿ではないでしょうか。
ここも馬鹿文系ばっかりか (スコア:1, 参考になる)
GPUを利用したのは確かに安くて速いんだけど精度の問題で
利用できる範囲は非常に狭いです。
地球コンピュータとこれを単純に速度だけ比べるというのは
全く意味の無い比較
Re:ここも馬鹿文系ばっかりか (スコア:2, すばらしい洞察)
Re:ここも馬鹿文系ばっかりか (スコア:1, すばらしい洞察)
答えた人間が間抜けだったってだけのことでは。
むしろ仕分け人の方がスパコン開発の意義を理解してたんじゃないかな。
Re:ここも馬鹿文系ばっかりか (スコア:2, 参考になる)
それは即ち、そんな答えをする人間を連れてきた文部科学省が間抜けだって事だ。
質問内容なんぞ7月の国会での質疑の時の話そのままじゃないか。
仕分け人はちゃんとその時の流れを以って質問していた。
しかし相手はその時の質問の答えすら用意していないとは思わなかったろう。
「きちっと説明されていれば、こういう結論にはならない」という枝野氏の発言
の表だけを見て揶揄する奴等は多いが、ちょっと違うよね。
「宿題に答えて具体的に説明を行えば、ある程度救ってやるお膳立てはしたのに」
って意味に取るべきだろ。
蓮舫氏の2位云々の話も「2位以下の結果となっても意義はある」という話の呼び水
としてわざわざ用意したのに回答者が無視しただけだし。
Re:ここも馬鹿文系ばっかりか (スコア:1)
優香氏やIMALU氏ってのも変ですしね。
ドウシテオレハ、ココニイルンダ!
Re:ここも馬鹿文系ばっかりか (スコア:2, 参考になる)
事業仕分けのスパコン(スカラー)と今回のスパコン(GPU)はまったく別物。地球シミュレータ(ベクトル)も。
GPUを用いた今回のやつは、例えば100個の足し算や引き算をまとめて一回とかでしちゃうので、
スカラー型のスパコンに比べれば単純な性能は100倍とかになったりします。
なので単体あたりの性能も500GFlopsとかって言われているけど、実際の科学技術計算とかでは
そんなに単純な計算ばかりだけではなく、
(A*((B+C)-D)*cos(E)-F)/G
何て計算式があったときには、まずB+Cをし、次にAを掛けて・・・と1つずつしないとなると、
GPUでは極端にスピードが落ちる。
しかし、スカラー型は単純な足し算引き残だけではなく難しいアルゴリズムを用いた複雑な計算式を
一回で解けるようにしていたり、複素数が使えたりとか小数点とか計算精度も高かったりします。
GPUが得意なモニタは点の集まりで構成されており、3次元でこの部分が影になるから黒に近づけるとか、
透明化しているように見えるために色を組み合わせるとか、の点々の計算が大量にあるから、そういう
処理はGPUが得意。
今のPCに乗っかっているCPUもネットしながら動画を見たり、音楽聞いたりと様々な計算をする必要があり、
スカラー型です。曲を同じタイミングで100曲ながしたりとかしないよね??
地球シミュレータのベクトル型もGPUと同じような動作を行いますが、地球を1km四方とかで区切って、
同じような計算をいっぱいするから。
地球シミュレータがGPUと違ってすごいのは、GPUは1個の数字が8桁までとかだけど、
地球シミュレータは32桁まで大丈夫とかってなるわけです。
8桁までの計算をするんだったら、GPUでもいいけど、32桁の計算をするんだったら、
地球シミュレータしか無理となる。
なんで、GPUは何で32桁にしないかというと、GPUとして使っているから、必要ないのです。
通常の液晶ディスプレイは1677万色しか生成できず、1000億色まで生成できるといっても
人間に判断できないので、作る必要が無いし、作ったら当然コストも高いし、電力も食う。
もっと言うとでかい数字を大量にするとなったときに、メモリからCPUにデータを大量に送る
必要がでてきて、GPU用のGDDR5なんていうグラフィックに最適化したDDRメモリを乗っけていますが、
それでも速度的には限界。
ベクトル型CPUにはもっと専門的なメモリからの転送手法が必要になってきます。
しかし、そのような手法はとても難しく、地球シミュレータが最後のベクトル型でトレンド
としては今はスカラー型が多くなってきている。
でも、地球をシミュレーションするような気象関係の計算には、今でもベクトル型の方が有利。
一般にも使われているGPUを使っている今回のやつは当然値段も安い。
Re:ここも馬鹿文系ばっかりか (スコア:1, すばらしい洞察)
>非常に狭い
こういう馬鹿文系的な表現でなく、データ(有効制度の範囲など)を示していただくと、コメントの説得力が増しますよ。
Re:ここも馬鹿文系ばっかりか (スコア:1)
GPUで高速計算出来るのは単精度(32bit)
多くの科学技術計算で使われているのは倍精度(64bit)
ちなみに、おいらがプログラミングしている処理も単精度だとまったく桁数が足らないのでこの意見に同意。
Re:ここも馬鹿文系ばっかりか (スコア:1)
しかもちょっと前までIEEE 754な浮動小数点演算ですらなかったりするので要注意でした。
# まぁ、描画用演算に人間の目が識別出来ないような精度や丸め方はそんなに重要じゃなかったろうしねぇ
Re: (スコア:0)
下の方 [srad.jp]でも指摘されているとおり、今時のGPUは倍精度でもなかなかの速度を出しますよ。
NVIDIAの次世代GPU (Fermi) は、明らかに倍精度での性能を重視した作りになっています。
Re:ここも馬鹿文系ばっかりか (スコア:1)
つまり、浮動小数点演算部分を 32bit から 128bit に増強した GPU を nVIDIA に大量生産してもらえばいいって事ですな。
…っていうか、地球シミュレーターってベクトル型なんだから、あいつの中に入っているベクトル演算部の設計を一部流用して、GPUを作ればいいんじゃないか? > NEC
PC用になるかどうかはともかく、映画とかの高精細画像を必要とするエリアには使えるだろう。ハリウッドとかも大量購入しそうな気がするぞ?
で、そうやって大量に出来たGPUの在庫を使ってスパコンを作る…なぁ、2012年までに間に合うような、嫌な予感がしないか?
fjの教祖様
Re: (スコア:0)
つまり、浮動小数点演算部分を 32bit から 128bit に増強した GPU を nVIDIA に大量生産してもらえばいいって事ですな。
いやそれやったらこんなに安くなんないから。 これはあくまで大衆向けのチップを流用してるから価格性能比が高いってだけで。
Re:ここも馬鹿文系ばっかりか (スコア:1)
国や地方が買うPCの購入用件にこのGPUの利用を追加して、その分の予算として京速スパコンの予算を割り振れば、量産効果ぐらいあっという間に …
fjの教祖様
Re: (スコア:0)
>> 国や地方が買うPCの購入用件にこのGPUの利用を追加して、その分の予算として京速スパコンの予算を割り振
そんな努力をしたところで,全世界のPC市場の規模を考えたら誤差みたいなレベルでは?要はマーケットがそういう機能や性能を欲しているかどうかという問題でしょう.
しかも上記説明の前半部も後半部も結局は税金投入というあたり,「財源なんか気にしないで税金はジャンジャン使いましょう」という発想ですか?
Re:ここも馬鹿文系ばっかりか (スコア:1)
nVIDIAの3Dチップが搭載されているPCなんぞ、全世界のPC市場の規模から考えたら誤差にすらならないレベルです。大丈夫。
PCサーバーという巨大なマーケットのほとんどで、GPUは不要とされている、という事実を考慮しよう。
実際問題、GPUがもっと汎用性のあるビット長になってくれると、暗号/復号周りの処理なんかがGPU任せにできるようになり、利便性は向上します。そうすると、今まで存在しなかった「サーバ市場」と言うものが開ける。で、結果として台数も売れる。当然スケールメリットはでまくります。
fjの教祖様
Re: (スコア:0)
NECとしては、「 インテルとNEC、将来に向けたスーパーコンピューター技術の共同開発に合意 [nec.co.jp]」の枠組みでやるみたい。
Re:ここも馬鹿文系ばっかりか (スコア:1, すばらしい洞察)
Re:ここも馬鹿文系ばっかりか (スコア:1, おもしろおかしい)
ベンチマーク厨にとってはトップスピードが最重要で、精度や信頼性は三の次なんですよ。
Re: (スコア:0, 参考になる)
>地球コンピュータ
そう言ってる本人の方がより馬鹿に見えてしまうと話が続かないので、
他人を馬鹿呼ばわりするときは用語や言葉遣いに注意した方が良いです。
Re: (スコア:0)
地球コンピュータも同様のことが言えるね
Re: (スコア:0)
>地球コンピュータも同様のことが言えるね
確かに、「究極の疑問とは何か?」にしか使われませんでしたからね。
疑問の解答は「42」だと解っておりますが。
Re: (スコア:0)
>精度の問題で利用できる範囲は非常に狭いです。
倍精度の演算器では足りないの?
四倍精度などのそれ以上をソフトウェア的にやっても駄目?
今のGPGPUだと、最近出た新しいやつでピーク性能は倍精度で500GFLOPSぐらい。
その前の世代でも250GFLOPSぐらい。
倍精度でよければ数百基積めばそれなりの速度は出ると思うけど?
#ソフトウェア側の工夫がいるとか、分割できる問題でないとというのは当然だけれども。
Re:ここも馬鹿文系ばっかりか (スコア:4, 参考になる)
GPUは、速度は滅茶苦茶速いですけど、メモリが少ないので、性能を引き出すのがすごく難しいんですよ。
以前書いたコメントからのコピペ [srad.jp]なので、1年以上前の情報ですが、
って感じ。それでも、GPUは単価が安いので数で攻めることができるわけですが、プログラミングの難易度は格段に高いと思います。
ちょっとした違いで速度が大幅に変わってきます。
今回の事例では、768GPUみたいですが、1GPUが1TFlopsとしても、
ピーク768TFlopsで、実効158TFlopsと、20%もの性能を引き出してることになります。
GPGPUでこれだけ性能を出せたのは、「扱っている多体問題がGPGPU向けだった」ってことと「プログラマが凄く頑張った」ってことは言えると思います。
このコンピュータが、「どんな問題でもそれだけの性能が出せる」って考えてはダメでしょう。
Re:ここも馬鹿文系ばっかりか (スコア:2)
研究対象は(元から)GPGPU向けの問題だったのではと思いましたが、
理研のプレスリリース [riken.go.jp]によると
とのことで、プログラマが凄く優秀かつ凄く頑張って
扱っている多体問題をGPGPU向けのアルゴリズムで解けるようにした、ではないでしょうか。
GPGPUでのプログラミング能力と、GPGPU向きのアルゴリズムを考案する能力が揃わなければ
これだけの成果は出なかったと思います。
新しいアルゴリズムの開発が出来る問題ばかりではないでしょうし、出来るような人材がごろごろいるわけでもないでしょうから
大規模な次世代スパコンの開発も行うべきだと思いますが、こういった人材を育てる方面にももっと予算を出して欲しいです。
上手く育ってくれない例のほうが多いかもしれませんが、上手くいくと初めから分かっていれば
国が予算を出さなくとも、余裕のある企業が手を出すでしょうし・・・
# HTMLのプレスリリースの一部がダブっているのは、大事なことなので二回言いました?
単なる臆病者の Anonymous Cat です。略してACです。
Re:ここも馬鹿文系ばっかりか (スコア:1, 興味深い)
>って感じ。それでも、GPUは単価が安いので数で攻めることができるわけですが、プログラミングの難易度は格段に高いと思います。
>ちょっとした違いで速度が大幅に変わってきます。
それはそうなんだけど、元々日本がやってたベクトルコンピュータもそれは基本的に同じ問題を抱えてた訳で。力技のスカラー&超並列が主流なのも、そこら辺をカバーして余りある汎用性と、単体で足りないところは数でカバーが出来るほどの低コスト(比較)にある訳ですからねぇ。
それはともかく、今回の受賞もH/Wに対してではなく問題解決のソフトウェア部分に対してでしょう? スラドでもなにやらH/Wの話ばかりでそこがあまり取り上げられないのはなんだかな。
京速計算機プロジェクトに今一支持したい気になれないのは、結局はH/Wに偏重しすぎている従来型ハコモノ土建型公共事業の匂いが強すぎて、ソフトウェアやサービスのコストを評価しないところですね。
Re:ここも馬鹿文系ばっかりか (スコア:1, 興味深い)
つい忘れがちなんだけど、今日日そこそこの規模のクラスタくらいならみんな自前のを持ってんだよね。
それだけじゃどうしてもだめだっつんで、共用の大型スパコンの世話になるわけで。
> 京速計算機プロジェクトに今一支持したい気になれないのは、結局はH/Wに偏重しすぎている従来型ハコモノ土建型公共事業の匂いが強すぎて、ソフトウェアやサービスのコストを評価しないところですね。
クラスタでCFDやってる人を見れば、ベクトル機買ってあげようよという気にはなるけどね。ソフトウェアやサービスのコストってこういうことでしょ。
Re: (スコア:0)
リンク先の西日本新聞の記事では
> GPUを大量につなげられるプログラムの開発が成功のカギとなり、数百億円規模が必要とされる開発費用を3800万円に抑えたという。天体物理学などの複雑な計算での活用が見込まれる。
と、きちんと報じられていますので、スラドはマスゴミ以下ということでしょうか。
Re: (スコア:0)
>性能を引き出すのがすごく難しいんですよ。
ああ、それは承知しているのですが、元コメの方が「精度の問題で」と書いてあったことに疑問を持ったもので。
#昔の単精度しかできないGPGPUならともかく、最近の倍精度もできるやつならそんなに問題にならんのじゃないかなあと。
Re: (スコア:0)
>GPUは、速度は滅茶苦茶速いですけど、メモリが少ないので、性能を引き出すのがすごく難しいんですよ。
なのでnVidiaの次期GPU Fermiでは内部メモリが増え、より汎用計算向けになりました(3DCG描画はその一環) [impress.co.jp]。
Re: (スコア:0)
そういう性能って、本来のGPUの役割として必要なんだろうか。倍精度計算も含めて
グラフィック描画のついでで計算するならともかく、計算目当ての設計になってくるとだんだん一般人向けじゃなくなりコストが上がってくるような……
Re: (スコア:0)
普通は単一デザインのほうが安くなります。製造コストが倍になったりはしませんので。
現在TOP5のGPUスパコン天河は実行性能25%とか (スコア:0)
2位のCELLを使った奴が75%だそうで、この差はローカルメモリと推測されてますので
すでにコメントされてますが、ローカルメモリとして固定できるキャッシュを搭載したFermiなら
もう少しいけそうですね。
もちろんメモリ帯域にだけスケーリングするようなプログラムならベクトル機最強ですけど。
Re: (スコア:0)
こういう反論しかできなきゃ、そりゃ文系にバカにされるよなぁ。
いや、文系だけなのか!?
スーパーコンのユーザーやその関係者の皆様によってなんとか復活への希望の光が見えてきたけど、
ユーザーだってダメ開発者の尻拭いをいつまでもできる訳じゃないんだよ。
いわゆる理系の人たちからどう見られているか、
スーパーコン開発者とその周りの人はもっと世間に目を向けるべき。
Re: (スコア:0)
ポリゴンがいっぱい出ればいいのです
Re: (スコア:0)
そんなのはソフトでカバーすれば良い。
それでパフォーマンスが落ちるのなら、今度は台数でカバーすれば良い。
なんたって、コストパフォーマンスが10倍以上違う物だから。
そして複数台あれば必要時以外は分割して広く利用が出来るという、
一点豪華主義には無い利点も出る。
富士通の社外デザインベースのスカラーオンリーマシンを作っても、
技術的蓄積って点じゃ富士通の経験値にしかならん。
それも既に他社が成し遂げているスキルに付いての物だけ。
日立やNECが抜けたのは「開発」でなく「構築」って面が高く、
持ち出しコストの割には見返りが無いって判断な訳だし。
Re:ここも馬鹿文系ばっかりか (スコア:1, 参考になる)
ってーのが何を指してるのか今一よくは分かりませんが。
あそこのスパコン用のアーキのフロントエンドをSPARCに挿げ替えたものがSPARC64なんですが。
それでも「社外デザインベース」なんですかね?
スカラーオンリーいってるけど、VenusはSIMD拡張を行ってますけど。
「デザイン」ってのはISAの設計のこと。SIMD拡張しても「スカラーオンリー」ってを言うんだったら、IntelだってAMDだって「社外デザインベースのスカラーオンリー」のプロセッサを作ってるってことになりますねw
Re: (スコア:0)
台数が増えると、故障率というか信頼性の問題が。
最近はメモリエラーが多い……
Re: (スコア:0)
> ここも馬鹿文系ばっかりか
> 2chのニュー速あたりと変わらないのかスラドも…
自己紹介ですか?
Re: (スコア:0)
Re: (スコア:0)
なんだ下手なODAより安いのか
総理の母親にもらえよ
エンジンパワーだけ比べちゃ駄目よ (スコア:0)
F1なんて2400ccだけど、トヨタのエスティマ(2400ccの)と同じですよ?
それと同じ論理展開ではさすがに言葉が足りな過ぎるというものです。
#つまり、別種のものを比べる愚を冒してないか?の視点が必要。
Re:エンジンパワーだけ比べちゃ駄目よ (スコア:1, すばらしい洞察)
F1カーと比較するなら、WRCカーにしときなさい。サーキットならF1カー、グラベルや雪上ならWRCカーが速い。
別種のものを比べること自体は愚かではない。愚かなのは、用途や使用条件の違うものを、ある一つの指標をもって、要・不要を語ること。
Re: (スコア:0)
普通は出力(馬力とかトルク)だよ。
排気量500ccのエンジンで300馬力を目指そうとしたのが
次世代スパコン開発事業。
それに対して諸外国では排気量5000ccのエンジンで
300馬力を実現しちゃう。
400馬力欲しけりゃ8000ccにする。
そして今回は、2000ccのエンジンで300馬力出しました
ってところじゃないかな。
別種のものを比べてるのではなくて、求められている結果が
同じなのに開発コストが違い過ぎるという話。
300馬力を出すという結果は同じという点を考えてみて。
馬力を求めるのか、トルクを求めるのかという違いはあるかもしれない。
Re:エンジンパワーだけ比べちゃ駄目よ (スコア:1)
>そして今回は、2000ccのエンジンで300馬力出しました
>ってところじゃないかな。
車で例えるなら、ピーキー過ぎて使えないとか、燃料効率が悪すぎるというのもありそうだな。
Re: (スコア:0)
>同じなのに開発コストが違い過ぎるという話。
>300馬力を出すという結果は同じという点を考えてみて。
>
>馬力を求めるのか、トルクを求めるのかという違いはあるかもしれない。
それって、戦車用の1000馬力のガスタービンエンジンと
航空機用の星型空冷1000馬力エンジンを
同じ土俵で競争させるようなもんだと思うんですが……
馬力やトルク以外にも色々違いが出てきますよね?
Re: (スコア:0)
NECと日立が抜けて単なるスカラ型になった時点で、RoadRunnerやJaggerと同じ土俵上での単なる馬力競争という状況になってるから、少なくとも飛行機と戦車ほどの違いはない。高出力のガスタービンエンジン&口径のでかい主砲を備えた戦車を今から開発して配備するか、レシプロエンジン搭載の既存の戦車のエンジンや主砲をちょっとチューンして大量配備するか、という程度の違い。
ただし、仮想敵(=その戦車が必要な理由)は明確になっていない、ということころかな。
Re: (スコア:0)
ただし作り方によっては運搬量にスーパーを見いだすトラックと、
スピードにスーパーを見いだすスポーツカーみたいな違いは現れるから使われ方は大幅に変わるけどね。
戦車の派生みたいな狭い範囲のバリエーションだけでなく。
同じ作り方なら同じ系統にはなるが、計算ひとつ取っても必要なハードは結構違うのよね。
汎用にしすぎると逆に効率が悪くなるし、効率を求めれば潰しが利かなくなる。
なので価格が高くなる程バランスが求められるけど、その匙加減は難しいね。
加えて今時のスパコンなんて総じてハイブリッドなので、純然たるスカラー機なんてのは無いしさ。
そのハイブリッド具合も匙加減の一つだし、クラスタアーキテクチャをどうするかは面白い分野かもね。
もっとも、計算対象によってそれが決まる場合もあるのが厄介だけど。