パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

東大、1チップ 512 GFlops の512コアプロセッサ発表」記事へのコメント

  • by volatile (27445) on 2006年11月07日 10時09分 (#1052745)
    もともと GRAPE は多体問題 [wikipedia.org]に
    特化されたプロセッサでしたが,だんだんと汎用性を増す方向には進化しているようですね.

    世界最速のプロセッサやシステムとして認定されるにはTOP500 [top500.org]で
    使用されているテスト(LINPACK)が走るかどうかと,そのときのパフォーマンスが
    問題になるんじゃないかと思います.

    • by Qs (1185) on 2006年11月07日 13時30分 (#1052955) 日記
      これまでのGRAPEとは少しアプローチが違ったかな、という感じがしている。

      これまでは処理内容は演算器制御としてLSIにハードコードされ、少しの演算内容は変えられるけど大きく内容を変更することはできなかった。

      それに対し、今回は演算器制御を思い切って外に出し、多数の演算器と共有メモリのみで構成し、演算器を制御する信号を外からもらう形にしている。外に出た演算器制御はFPGAに実装するので、これをプログラミングしたら重力問題でもLINPACKでもライフゲームでも何でも行える専用機に化けるという仕組みだと考えられる。

      よって、プログラミングモデルはソフトというよりハードウェアに近い。一応Cコンパイラも開発しているとあるが、どこまで使い物になっているかはちと推測できない。

      ここまで書いて、浮動小数点演算に特化したリコンフィギャラブルプロセッサに近いね、と思った。

      プロセッサエレメントは共有メモリとのみつながっているいるようだ。その共有メモリもたぶん小さく、PE間のメイルボックス程度しか考えられない。ということは、処理内容はストリーム的に流れていくものが得意そうだ。だったらPE間が直接つながるパスもあってよいと思うが、よくわからない。

      以上、だらだらと妄想した結果である。

      親コメント
      • by annoymouse coward (11178) on 2006年11月07日 15時05分 (#1053013) 日記
        プロセッサエレメントは共有メモリとのみつながっているいるようだ。その共有メモリもたぶん小さく、PE間のメイルボックス程度しか考えられない。ということは、処理内容はストリーム的に流れていくものが得意そうだ。だったらPE間が直接つながるパスもあってよいと思うが、よくわからない。


        まさにPS3のCellはそのような設計 [impress.co.jp]になっていますね.GRAPEとCELLのアプローチには通ずるところが多く,今後このようなアプローチが成功するか失敗するかにはとても興味があります.
        親コメント
        • Re:汎用性はどうだろう (スコア:1, すばらしい洞察)

          by Anonymous Coward on 2006年11月07日 15時22分 (#1053034)
          どこが「まさにそのような設計」なんでしょうか?
          各自256KBのローカルメモリを持っているRISCプロセッサを8個実装したCellと
          ALU+レジスタのセットであるPEをたくさん並べてパイプラインを構成するGRAPE-DRでは
          まったく構造が違いますよ。
          親コメント
          • >各自256KBのローカルメモリを持っているRISCプロセッサを8個実装したCellと

            CellのSPEでもパイプラインを組む手法はありますよね。
            どこが違うのですか?
            • Re:汎用性はどうだろう (スコア:2, すばらしい洞察)

              by tarosuke (2403) <webmaster@tarosuke.net> on 2006年11月08日 12時01分 (#1053771) 日記
              >どこが違うのですか?
              GRAPE-DRのほうがアプローチがラディカル。まず何より数が違う、これだけあればまるごとパイプラインに収まる数式も多い。また、個々の演算噐はALUであって命令デコーダを持ったプロセッサではない、似たような手法を取れるからといって同じというわけでもない。
              親コメント
    • Re:汎用性はどうだろう (スコア:2, すばらしい洞察)

      by genzin (23225) on 2006年11月07日 13時34分 (#1052958) 日記
      既に2次元の気象シミュレーションなどは動作しているようですが、
      汎用の有限要素解析プログラムがこのチップ上で動くようになると
      エンジニアリングの世界が変わるかもしれませんね。
      それこそ専門化がクラスタ使ってまわすような計算を、PCで出来る
      だけで効率が全く変わってくる。

      そのためには、巨大な疎行列演算を高速に処理したり、分岐や例外
      が多数存在する演算を自由に振り回せないといけませんが、そういう
      用途だとインテルの [nikkeibp.co.jp]のほうが適しているかなぁ。

      なんにせよ、早くこの手の倍精度でパフォーマンスが出るアクセラレータ
      が一般的にならないかと待ち焦がれてます。
      親コメント
    • by volatile (27445) on 2006年11月07日 10時20分 (#1052756)
      すみません.wikipedia が正しく引けていませんでした.
      URL に日本語(2バイト文字)を入れたタグを用いると
      2バイト文字部分が削除されるようですね.

      http://ja.wikipedia.org/wiki/多体問題

      を参照ください.

      親コメント
    • ゲームの物理演算なんかには使えないですかね?
      • by Anonymous Coward on 2006年11月07日 18時28分 (#1053183)
        使えない気がする。

        大体、普通のGPUやCPUの方が圧倒的に速いと思う。
        このプロセッサーの特長は処理は遅いが時間辺りの処理が高い
        のが売りのプロセッサーでしかないだろう。
        これをゲームに使った場合、実時間ないでうまく戻ってくるかでしょうね。

        ゲーム機よりは大掛かりなシミュレーションシステムで
        十分なキャッシュデータが持てる装置の演算補助装置みたいな使い方がよいのでは?
        親コメント
    •  http://pc.watch.impress.co.jp/docs/2006/1106/tokyou.htm/ [impress.co.jp]  によると、「動作周波数500MHzで512G FLOPSの演算性能を1チップで実現。消費電力は最大60W、アイドル時30W」とのことで、この低動作周波数、低消費電力も凄いですね。  これって、普通のパソコンのコプロセッサに使えないのだろうか。  何に使えるかわからないけど、グラフィック演算用とか……、教えてエロいひと。
    • 自分の作ったプログラムが移植できるのか?と思っているひとも多いと思われる.
      記事を読んでも,サイトを見ても,そこらへんは分からなかった.
    • by Anonymous Coward
      通常のプロセッサーと比較して圧倒的な速度で演算しているのではなく、
      定型的な単調な演算を同時に行う事での圧倒的な演算ですから
      汎用性からいえば全く意味なんてないと思います。

      使えば効果が出るかもしれませんが、使わなくても対して変わらない
      というのが一般ユーザーにニーズでしょうね。

      最近のゲームに利用可能?と思うかもしれませんが
      複雑な重たい計算が実時間内に終るととも言えませんしこれも難しいですね。

      #これって行列演算プロセッサーじゃないのですか?

ソースを見ろ -- ある4桁UID

処理中...