cyber205の日記: いつのまにx86はベクトルプロセッサになったのだ 3
【基本】CPUやGPUの理論値FLOPSの計算方法と測定方法
64bit化で随分レジスタセットが拡張されて、割り込みの時にはレジスタの退避とか大変だろうなと思ってはいたのだが、最近のx86は本当に何でもアリな感じになっている。
最近知ったが、スーパーコンピュータに搭載されているようなベクトルレジスタが、今や普通にx86プロセッサには実装されているのだという。
「Intel Xeon Skylake-SP Gold」の例だけど、AVX512命令ってのがあって、64bitの倍精度浮動小数点演算を1命令で8個、しかもFMA演算器を搭載しているので1クロックで足し算と掛け算を実行する。そのALUを2台搭載してるから、1クロックで倍精度の浮動小数点演算を32回も実行できることになる。
12コアタイプのXeonは、ほぼ1TFLOPSの演算性能があるようだ。
ただ、CPUに与える負荷も相当なモノらしく、ベクトルレジスタでの演算中には実効クロックが下がるらしい。