アカウント名:
パスワード:
世界最速のプロセッサやシステムとして認定されるにはTOP500 [top500.org]で 使用されているテスト(LINPACK)が走るかどうかと,そのときのパフォーマンスが 問題になるんじゃないかと思います.
これまでは処理内容は演算器制御としてLSIにハードコードされ、少しの演算内容は変えられるけど大きく内容を変更することはできなかった。
それに対し、今回は演算器制御を思い切って外に出し、多数の演算器と共有メモリのみで構成し、演算器を制御する信号を外からもらう形にしている。外に出た演算器制御はFPGAに実装するので、これをプログラミングしたら重力問題でもLINPACKでもライフゲームでも何でも行える専用機に化けるという仕組みだと考えられる。
よって、プログラミングモデルはソフトというよりハードウェアに近い。一応Cコンパイラも開発しているとあるが、どこまで使い物になっているかはちと推測できない。
ここまで書いて、浮動小数点演算に特化したリコンフィギャラブルプロセッサに近いね、と思った。
プロセッサエレメントは共有メモリとのみつながっているいるようだ。その共有メモリもたぶん小さく、PE間のメイルボックス程度しか考えられない。ということは、処理内容はストリーム的に流れていくものが得意そうだ。だったらPE間が直接つながるパスもあってよいと思うが、よくわからない。
以上、だらだらと妄想した結果である。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson
汎用性はどうだろう (スコア:3, 参考になる)
特化されたプロセッサでしたが,だんだんと汎用性を増す方向には進化しているようですね.
世界最速のプロセッサやシステムとして認定されるにはTOP500 [top500.org]で
使用されているテスト(LINPACK)が走るかどうかと,そのときのパフォーマンスが
問題になるんじゃないかと思います.
Re:汎用性はどうだろう (スコア:5, 興味深い)
これまでは処理内容は演算器制御としてLSIにハードコードされ、少しの演算内容は変えられるけど大きく内容を変更することはできなかった。
それに対し、今回は演算器制御を思い切って外に出し、多数の演算器と共有メモリのみで構成し、演算器を制御する信号を外からもらう形にしている。外に出た演算器制御はFPGAに実装するので、これをプログラミングしたら重力問題でもLINPACKでもライフゲームでも何でも行える専用機に化けるという仕組みだと考えられる。
よって、プログラミングモデルはソフトというよりハードウェアに近い。一応Cコンパイラも開発しているとあるが、どこまで使い物になっているかはちと推測できない。
ここまで書いて、浮動小数点演算に特化したリコンフィギャラブルプロセッサに近いね、と思った。
プロセッサエレメントは共有メモリとのみつながっているいるようだ。その共有メモリもたぶん小さく、PE間のメイルボックス程度しか考えられない。ということは、処理内容はストリーム的に流れていくものが得意そうだ。だったらPE間が直接つながるパスもあってよいと思うが、よくわからない。
以上、だらだらと妄想した結果である。
Re:汎用性はどうだろう (スコア:3, 興味深い)
まさにPS3のCellはそのような設計 [impress.co.jp]になっていますね.GRAPEとCELLのアプローチには通ずるところが多く,今後このようなアプローチが成功するか失敗するかにはとても興味があります.
Re:汎用性はどうだろう (スコア:1, すばらしい洞察)
各自256KBのローカルメモリを持っているRISCプロセッサを8個実装したCellと
ALU+レジスタのセットであるPEをたくさん並べてパイプラインを構成するGRAPE-DRでは
まったく構造が違いますよ。
Re:汎用性はどうだろう (スコア:0)
CellのSPEでもパイプラインを組む手法はありますよね。
どこが違うのですか?
Re:汎用性はどうだろう (スコア:2, すばらしい洞察)
GRAPE-DRのほうがアプローチがラディカル。まず何より数が違う、これだけあればまるごとパイプラインに収まる数式も多い。また、個々の演算噐はALUであって命令デコーダを持ったプロセッサではない、似たような手法を取れるからといって同じというわけでもない。