GPUは1TFlopsの時代へ、GPGPUに弾みが付くか 20
ストーリー by hylom
これでもGPUというのだろうか 部門より
これでもGPUというのだろうか 部門より
NVIDIAとAMDがそれぞれハイエンドGPU─GeForce GTX 280とRadeon HD 4850(いずれもリンク先はPC Watchの記事)─を発表したが、併せてこれらをベースとするGPGPUも発表された。
GeForce GTX 280をベースとするTesla-10シリーズ(カード型製品はTesla C1060、The Registerの記事)とRadeon HD 4850ベースのFireStream 9250(PC Watchの記事)で、処理能力はどちらも1TFlops(FireStream 9250は1TFlops以上)。Tesla-10は新たに倍精度演算に対応した(FireStreamは先代の9170から対応)。
倍精度の性能は単精度に比べて落ちるようだが(FireStream 9250で200GFlops超、Tesla-10に関する記述は見あたらなかった)、NECのスーパーコンピュータ「SX-9の1ノードでの最大性能が1.6TFlopsとのことのなので、カード1枚としては非常に高性能と言えるだろう。
この前1ペタFlopsを達成したIBMのRoadRunnerはOpeteron+Cellの構成だったが、今後はTop500の上位にCPU+GPUタイプのスーパーコンピュータが登場するようになるのだろうか。
倍精度の性能 (スコア:3, 参考になる)
後藤さんの記事によると、
http://pc.watch.impress.co.jp/docs/2008/0617/kaigai446.htm [impress.co.jp]
とのことで、結構落ちるみたいですね。
倍精度が一般化してからが本番 (スコア:2, 興味深い)
いかんせん開発が複雑になって実際には使われないというケースが多いんですよね。
特に、発見的な作業の場合は絶望的に採用されない。
早く倍精度を実用化して欲しい所です、なにしろパフォーマンスのケタが違いますから。
CPU+GPUタイプの空気清浄機みたいな形のスーパーコンピュータ (スコア:1)
SCEいわくRSXの浮動小数点演算性能は1.8 TFLOPSらしいので、GPGPUにも向いてるんじゃないですか?
Re:CPU+GPUタイプの空気清浄機みたいな形のスーパーコンピュータ (スコア:1, 参考になる)
Wikipediaのソースで恐縮ですが、その1.8TFLOPSという数字は怪しいようです
NVIDIAの最新フラッグシップGPUで1TFLOPSですからねぇ
Re:CPU+GPUタイプの空気清浄機みたいな形のスーパーコンピュータ (スコア:1)
いずれにしてもRSXはGF7800時代の設計でしかもメモリバスの狭い
いわゆる「128bit地雷」ですからGPGPUではteslaの足元にも及ばないかと。
並列コンピューティングに使うことを考えた場合、ゲーム機を越えた何かは
7コアのCPUもついて5万そこそこで買えるのが魅力かなぁ。
Re:CPU+GPUタイプの空気清浄機みたいな形のスーパーコンピュータ (スコア:2, 参考になる)
# confidentialなのでAC
Re: (スコア:0)
4万そこそこでしょ
Re: (スコア:0)
Re:CPU+GPUタイプの空気清浄機みたいな形のスーパーコンピュータ (スコア:1)
一応、LinuxからRSXを叩けたという話はあるようです。
http://ps3mods.blogspot.com/2007/12/ps3-rsx-accessed-through-linux.html [blogspot.com]
さぁ気になるのはやっぱりこれ (スコア:0, フレームのもと)
まぁ、OSがしっかり食ってくれるんでしょうが。
Re:さぁ気になるのはやっぱりこれ (スコア:5, おもしろおかしい)
2008/6/25出荷って言ってるんだから今月末には秋葉原に並ぶだろ。
Re:さぁ気になるのはやっぱりこれ (スコア:1, すばらしい洞察)
Linux+C言語で手軽に扱えないでしょうか? (スコア:0)
GPUに自分のシミュレーションモデルを渡すと面白いことが起こりそうなのだが、渡し方がわからなひ…
##そもそもLinuxでGPUを使おうというのが無謀?
Re:Linux+C言語で手軽に扱えないでしょうか? (スコア:3, 興味深い)
本日のニュース [mycom.co.jp]によると、CUDAとは違うOpenCLという環境で標準化されるという話も出ています。
Re:Linux+C言語で手軽に扱えないでしょうか? (スコア:1)
MS : DirectX / .NET Framework インタフェースとして、DirectCL(とか
を出してくれると、インタフェースが解決していいんだけどなー。とか
# や、OpenGL + OpenCLみたいなのが一番汎用性がいいのかもしれんがさ。
妄想だけどID
M-FalconSky (暑いか寒い)
Re:Linux+C言語で手軽に扱えないでしょうか? (スコア:1)
OpenCL [wikipedia.org]
Re:Linux+C言語で手軽に扱えないでしょうか? (スコア:3, 参考になる)
シェーディング言語を使った古典的な「GPGPUを用いた科学計算」に対する利点としては新しく専用の言語を習得する必要がないこと、ダミーの頂点シェーダが要らないこと、欠点としてはg80以降のnvidiaのGPUにしか対応していないのでやや敷居が高いこと、シェーディング言語を使った場合と比較して今ひとつ性能が出ないこと(ソース失念)が挙げられます。
用語の定義は正確にすべき (スコア:0, 参考になる)
単精度+倍精度で計算すると、全体の精度が低い方に引っ張られるので、
これも有効とは思えません。
FLOPSの定義が曖昧だから変な誤解を与えるんだよな・・・
Re: (スコア:0)
あとこんな話もあるんで
http://www.netlib.org/utk/people/JackDongarra/PAPERS/cell-linpack-2006.pdf [netlib.org]
単精度+倍精度が必ずしも無効だとは言えんかと思う。
#ライブラリがそろわんと使いにくいのは確かだが。
Re: (スコア:0)
> TOP500などのシミュレーションの世界で、単精度計算は相手にされません。
TOP500はシミュレーションじゃありません。
単精度で十分なシミュレーションコードも沢山あります。
> 単精度+倍精度で計算すると、全体の精度が低い方に引っ張られるので、
> これも有効とは思えません。
計算そのものは単精度で十分だが、一時的な合計の計算など一部で倍精度計算できると楽ができるようなアプリケーションで使います。
つかアンタ、数値計算のことを何も知らないでしょう。
> FLOPSの定義が曖昧だから変な誤解を与えるんだよな・・・
あなたのようなバカが誤解するだけです。