アカウント名:
パスワード:
世界最速のプロセッサやシステムとして認定されるにはTOP500 [top500.org]で 使用されているテスト(LINPACK)が走るかどうかと,そのときのパフォーマンスが 問題になるんじゃないかと思います.
これまでは処理内容は演算器制御としてLSIにハードコードされ、少しの演算内容は変えられるけど大きく内容を変更することはできなかった。
それに対し、今回は演算器制御を思い切って外に出し、多数の演算器と共有メモリのみで構成し、演算器を制御する信号を外からもらう形にしている。外に出た演算器制御はFPGAに実装するので、これをプログラミングしたら重力問題でもLINPACKでもライフゲームでも何でも行える専用機に化けるという仕組みだと考えられる。
よって、プログラミングモデルはソフトというよりハードウェアに近い。一応Cコンパイラも開発しているとあるが、どこまで使い物になっているかはちと推測できない。
ここまで書いて、浮動小数点演算に特化したリコンフィギャラブルプロセッサに近いね、と思った。
プロセッサエレメントは共有メモリとのみつながっているいるようだ。その共有メモリもたぶん小さく、PE間のメイルボックス程度しか考えられない。ということは、処理内容はストリーム的に流れていくものが得意そうだ。だったらPE間が直接つながるパスもあってよいと思うが、よくわからない。
以上、だらだらと妄想した結果である。
http://ja.wikipedia.org/wiki/多体問題
を参照ください.
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ソースを見ろ -- ある4桁UID
汎用性はどうだろう (スコア:3, 参考になる)
特化されたプロセッサでしたが,だんだんと汎用性を増す方向には進化しているようですね.
世界最速のプロセッサやシステムとして認定されるにはTOP500 [top500.org]で
使用されているテスト(LINPACK)が走るかどうかと,そのときのパフォーマンスが
問題になるんじゃないかと思います.
Re:汎用性はどうだろう (スコア:5, 興味深い)
これまでは処理内容は演算器制御としてLSIにハードコードされ、少しの演算内容は変えられるけど大きく内容を変更することはできなかった。
それに対し、今回は演算器制御を思い切って外に出し、多数の演算器と共有メモリのみで構成し、演算器を制御する信号を外からもらう形にしている。外に出た演算器制御はFPGAに実装するので、これをプログラミングしたら重力問題でもLINPACKでもライフゲームでも何でも行える専用機に化けるという仕組みだと考えられる。
よって、プログラミングモデルはソフトというよりハードウェアに近い。一応Cコンパイラも開発しているとあるが、どこまで使い物になっているかはちと推測できない。
ここまで書いて、浮動小数点演算に特化したリコンフィギャラブルプロセッサに近いね、と思った。
プロセッサエレメントは共有メモリとのみつながっているいるようだ。その共有メモリもたぶん小さく、PE間のメイルボックス程度しか考えられない。ということは、処理内容はストリーム的に流れていくものが得意そうだ。だったらPE間が直接つながるパスもあってよいと思うが、よくわからない。
以上、だらだらと妄想した結果である。
Re:汎用性はどうだろう (スコア:3, 興味深い)
まさにPS3のCellはそのような設計 [impress.co.jp]になっていますね.GRAPEとCELLのアプローチには通ずるところが多く,今後このようなアプローチが成功するか失敗するかにはとても興味があります.
Re:汎用性はどうだろう (スコア:1, すばらしい洞察)
各自256KBのローカルメモリを持っているRISCプロセッサを8個実装したCellと
ALU+レジスタのセットであるPEをたくさん並べてパイプラインを構成するGRAPE-DRでは
まったく構造が違いますよ。
Re:汎用性はどうだろう (スコア:0)
CellのSPEでもパイプラインを組む手法はありますよね。
どこが違うのですか?
Re:汎用性はどうだろう (スコア:2, すばらしい洞察)
GRAPE-DRのほうがアプローチがラディカル。まず何より数が違う、これだけあればまるごとパイプラインに収まる数式も多い。また、個々の演算噐はALUであって命令デコーダを持ったプロセッサではない、似たような手法を取れるからといって同じというわけでもない。
Re:汎用性はどうだろう (スコア:2, すばらしい洞察)
汎用の有限要素解析プログラムがこのチップ上で動くようになると
エンジニアリングの世界が変わるかもしれませんね。
それこそ専門化がクラスタ使ってまわすような計算を、PCで出来る
だけで効率が全く変わってくる。
そのためには、巨大な疎行列演算を高速に処理したり、分岐や例外
が多数存在する演算を自由に振り回せないといけませんが、そういう
用途だとインテルの [nikkeibp.co.jp]のほうが適しているかなぁ。
なんにせよ、早くこの手の倍精度でパフォーマンスが出るアクセラレータ
が一般的にならないかと待ち焦がれてます。
Re:汎用性はどうだろう (スコア:1)
URL に日本語(2バイト文字)を入れたタグを用いると
2バイト文字部分が削除されるようですね.
を参照ください.
参考 (スコア:0)
と展開すればO.K.よ。
# オフトピだけどvolatileさんの目にふれるまでマイナスモデちょっと待ってね。
Re:汎用性はどうだろう (スコア:0)
Re:汎用性はどうだろう (スコア:1, 興味深い)
大体、普通のGPUやCPUの方が圧倒的に速いと思う。
このプロセッサーの特長は処理は遅いが時間辺りの処理が高い
のが売りのプロセッサーでしかないだろう。
これをゲームに使った場合、実時間ないでうまく戻ってくるかでしょうね。
ゲーム機よりは大掛かりなシミュレーションシステムで
十分なキャッシュデータが持てる装置の演算補助装置みたいな使い方がよいのでは?
Re:汎用性はどうだろう (スコア:0)
Re:汎用性はどうだろう (スコア:0)
記事を読んでも,サイトを見ても,そこらへんは分からなかった.
全くない気がするw (スコア:0)
定型的な単調な演算を同時に行う事での圧倒的な演算ですから
汎用性からいえば全く意味なんてないと思います。
使えば効果が出るかもしれませんが、使わなくても対して変わらない
というのが一般ユーザーにニーズでしょうね。
最近のゲームに利用可能?と思うかもしれませんが
複雑な重たい計算が実時間内に終るととも言えませんしこれも難しいですね。
#これって行列演算プロセッサーじゃないのですか?
Re:汎用性はどうだろう (スコア:3, 興味深い)
それを言ったらGPUという言い方もNGだし。
Re:汎用性はどうだろう (スコア:0)
(個々のコアは重力の計算をするのみ.
パラメータを変えれば,少し違う計算が出来る.
その式をハードウェアで組んだもの.)
Re:汎用性はどうだろう (スコア:0)
GRAPEが何であるかについては、過去の関連ストーリーで何度も論じられてますね。
Re:汎用性はどうだろう (スコア:0)