アカウント名:
パスワード:
4命令のfloat演算
というのは間違いで、
4float演算
でしょう。一度に2回演算できる命令を呼べば良いんです。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
最初のバージョンは常に打ち捨てられる。
メモリ周りに触れられていないのですが (スコア:2, すばらしい洞察)
CPUのキャッシュ内に収まるような物で達成したところで、実際の利用を考えた上での実効速度はぐんと落ちるでしょうし、「ラボ内でこんな事も出来たんだよ」くらいにとらえておいた方が良いのかも。
Re:推測しよう (スコア:5, すばらしい洞察)
320[GFLOPS]/80[core]/1[GHz]=4。
つまり、1つのコアで1クロックあたり4命令のfloat演算を行っている。2つの単精度FPUしかないのに4命令ということは、SIMDか? それも16bitフローティング??
4命令がわかったので、記事中にある動作周波数と演算量を検証してみる。
「約3.1GHz時に1TFLOPS、5.67GHz時に1.8TFLOPS」という記述のこと。
4 * 80[core] * 3.1[GHz] = 992[GFLOPS]
4 * 80[core] * 5.67[GHz] = 1814[GFLOPS]
ここまできれいにスケールしていると、単純に演算器を動かすだけのテストの結果だろうと思われる。
LINPACKどころか、合成ベンチマークでもない可能性大。
Re:推測しよう (スコア:2, すばらしい洞察)
4命令のfloat演算
というのは間違いで、
4float演算
でしょう。一度に2回演算できる命令を呼べば良いんです。
Re:推測しよう (スコア:0)
日経エレクトロニクスのページ [nikkeibp.co.jp]によると
>演算ユニットは9段のパイプラインになっており,初めの5段が乗算,後の4段が加算を担当する。
>つまり演算ユニット1個で1サイクル2回の浮動小数点計算を行える。
…xxGflopsの値は思いっきり理論値っぽいような...せめてどんな計算をさせたのか公開してほしい