cyber205の日記: いつのまにx86はベクトルプロセッサになったのだ 3
日記 by
cyber205
【基本】CPUやGPUの理論値FLOPSの計算方法と測定方法
64bit化で随分レジスタセットが拡張されて、割り込みの時にはレジスタの退避とか大変だろうなと思ってはいたのだが、最近のx86は本当に何でもアリな感じになっている。
最近知ったが、スーパーコンピュータに搭載されているようなベクトルレジスタが、今や普通にx86プロセッサには実装されているのだという。
「Intel Xeon Skylake-SP Gold」の例だけど、AVX512命令ってのがあって、64bitの倍精度浮動小数点演算を1命令で8個、しかもFMA演算器を搭載しているので1クロックで足し算と掛け算を実行する。そのALUを2台搭載してるから、1クロックで倍精度の浮動小数点演算を32回も実行できることになる。
12コアタイプのXeonは、ほぼ1TFLOPSの演算性能があるようだ。
ただ、CPUに与える負荷も相当なモノらしく、ベクトルレジスタでの演算中には実効クロックが下がるらしい。
最近、Intelを抜いてCPU販売数首位に躍り出たAMDはというと、AVX512命令ではなく、AVX256とも言うべきAVX2命令セットに対応している。
性能はそこそこだけど、安く買えるのでいろいろ実験するには良さそうだ。
AVX搭載ってけっこー前のような (スコア:1)
AVXはSandy Bridge世代で搭載なので2011年、
AVX2はHaswell世代なので2013年には登場してますね。
Re:AVX搭載ってけっこー前のような (スコア:2)
Intel互換バイナリの観点から,Zen2からSIMDを256bitにしたんだよね。んでAVX2もネイティブ?で動作するようになった。
SkylakeはZen2に太刀打ちできず,
SkylakeのAVX512は爆熱のため,動作機種は限られ,
AVX-512標準対応のSunny Coveも,低クロックモバイルのIce Lakeしか出せず。
プロセスの躓きなので,いずれ解消するのでしょうが,
10nmのIntelデスクトップCPUは2022年という噂もあり,
さすがにそれは遅すぎるというか,
AMDのスケジュール通りなら最低でもZen3になってるわけで,それは筋が悪いだろ,という気もします。
これだけ好条件がそろっていながらも,
ジャイアントキリングすら容易ではない,
というのもまたAMDの現状だったりしますが。
Re:AVX搭載ってけっこー前のような (スコア:1)
128bit(単精度×4本)のSSEなら、1999年のPentiumIIIから搭載してますね。