アカウント名:
パスワード:
4命令のfloat演算
というのは間違いで、
4float演算
でしょう。一度に2回演算できる命令を呼べば良いんです。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲは一日にしてならず -- アレゲ見習い
メモリ周りに触れられていないのですが (スコア:2, すばらしい洞察)
CPUのキャッシュ内に収まるような物で達成したところで、実際の利用を考えた上での実効速度はぐんと落ちるでしょうし、「ラボ内でこんな事も出来たんだよ」くらいにとらえておいた方が良いのかも。
Re:推測しよう (スコア:5, すばらしい洞察)
320[GFLOPS]/80[core]/1[GHz]=4。
つまり、1つのコアで1クロックあたり4命令のfloat演算を行っている。2つの単精度FPUしかないのに4命令ということは、SIMDか? それも16bitフローティング??
4命令がわかったので、記事中にある動作周波数と演算量を検証してみる。
「約3.1GHz時に1TFLOPS、5.67GHz時に1.8TFLOPS」という記述のこと。
4 * 80[core] * 3.1[GHz] = 992[GFLOPS]
4 * 80[core] * 5.67[GHz] = 1814[GFLOPS]
ここまできれいにスケールしていると、単純に演算器を動かすだけのテストの結果だろうと思われる。
LINPACKどころか、合成ベンチマークでもない可能性大。
Re:推測しよう (スコア:2, すばらしい洞察)
4命令のfloat演算
というのは間違いで、
4float演算
でしょう。一度に2回演算できる命令を呼べば良いんです。
Re:推測しよう (スコア:0)
長いことブランクがあるので浮動小数点数の積和演算命令とか忘れてたよ…
例えばそういう命令をメモリいっぱいに並べてできるだけ長いループにして動かして「実際に性能が出た」ということね
なんだかすごく納得してしまいました
--
だれかわたしのかわりに親コメントに「すばらしい洞察」をあげてくれないかな