アカウント名:
パスワード:
>精度の問題で利用できる範囲は非常に狭いです。
倍精度の演算器では足りないの?四倍精度などのそれ以上をソフトウェア的にやっても駄目?
今のGPGPUだと、最近出た新しいやつでピーク性能は倍精度で500GFLOPSぐらい。その前の世代でも250GFLOPSぐらい。倍精度でよければ数百基積めばそれなりの速度は出ると思うけど?#ソフトウェア側の工夫がいるとか、分割できる問題でないとというのは当然だけれども。
GPUは、速度は滅茶苦茶速いですけど、メモリが少ないので、性能を引き出すのがすごく難しいんですよ。 以前書いたコメントからのコピペ [srad.jp]なので、1年以上前の情報ですが、
姫野ベンチのCUDA最適化という例を挙げられてたんですが、CPUだけだとは実測1GFlopsぐらいなんですが、理論値600GFlopsのGPU4枚で、実測50GFlopsぐらい出せたとか。コアはたったの2%しか働いてない
って感じ。それでも、GPUは単価が安いので数で攻めることができるわけですが、プログラミングの難易度は格段に高いと思います。ちょっとした違いで速度が大幅に変わってきます。
2位のCELLを使った奴が75%だそうで、この差はローカルメモリと推測されてますのですでにコメントされてますが、ローカルメモリとして固定できるキャッシュを搭載したFermiならもう少しいけそうですね。
もちろんメモリ帯域にだけスケーリングするようなプログラムならベクトル機最強ですけど。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
※ただしPHPを除く -- あるAdmin
たしかに (スコア:0)
地球シミュレータの開発が凍結されてもしかたありませんよね。
国の政策でなく、大学の研究レベルで高スペックのものが出来るようになったというのは
GPUメーカーのおかげではあるけれど、正しい研究開発の姿ではないでしょうか。
ここも馬鹿文系ばっかりか (スコア:1, 参考になる)
GPUを利用したのは確かに安くて速いんだけど精度の問題で
利用できる範囲は非常に狭いです。
地球コンピュータとこれを単純に速度だけ比べるというのは
全く意味の無い比較
Re: (スコア:0)
>精度の問題で利用できる範囲は非常に狭いです。
倍精度の演算器では足りないの?
四倍精度などのそれ以上をソフトウェア的にやっても駄目?
今のGPGPUだと、最近出た新しいやつでピーク性能は倍精度で500GFLOPSぐらい。
その前の世代でも250GFLOPSぐらい。
倍精度でよければ数百基積めばそれなりの速度は出ると思うけど?
#ソフトウェア側の工夫がいるとか、分割できる問題でないとというのは当然だけれども。
Re: (スコア:4, 参考になる)
GPUは、速度は滅茶苦茶速いですけど、メモリが少ないので、性能を引き出すのがすごく難しいんですよ。
以前書いたコメントからのコピペ [srad.jp]なので、1年以上前の情報ですが、
って感じ。それでも、GPUは単価が安いので数で攻めることができるわけですが、プログラミングの難易度は格段に高いと思います。
ちょっとした違いで速度が大幅に変わってきます。
現在TOP5のGPUスパコン天河は実行性能25%とか (スコア:0)
2位のCELLを使った奴が75%だそうで、この差はローカルメモリと推測されてますので
すでにコメントされてますが、ローカルメモリとして固定できるキャッシュを搭載したFermiなら
もう少しいけそうですね。
もちろんメモリ帯域にだけスケーリングするようなプログラムならベクトル機最強ですけど。