アカウント名:
パスワード:
Skylake-SP のラインナップがカオス [fc2.com]
Skylake-SPはAVX2を使う場合とAVX512を使う場合でクロックが異なり更に両方使わない場合もクロックが異なるので1コア辺り3種類のクロックが同時に存在し、通常命令(通常クロック) > AVX2(低クロック) > AVX512(更に低いクロック) の順でクロックが低く(つまり動作が遅く)設定されています。
AVX512は失敗作ではないか? [fc2.com]
AVX2よりもAVX-512の方が遅い論拠は、単純にAVX-512ではクロックが低く設定されている為で、AVX2 とクロックが等速になっても、それは等速になるだけで高速にはならず、理論的にもボトルネックを計算するとメモリ帯域で律速しているのは確かです。
正直にAVX-512は遅いので使わないで下さいと言って互換性目的で残すだけにして欲しいと思う訳です。
発熱が凄くてクロック落ちる、メモリ律速になる、って AVX512 に対応する必要性を感じないですねぇ
回路が大きいがゆえに発熱が大きくクロックが落ちるというのはSIMDの宿命なのでそれ言い出すとSIMDいらないってなる。回路の最適化で将来的に発熱が小さくなればオッケー。メモリ帯域がボトルネックということは言い換えればそこが早くなれば高速化できる。DDR5で1サイクル当たりの転送量が増えればボトルネックが解消されるかもしれない。無理やり擁護してみたものの全体的には早すぎた感じですかね。
早すぎるくらいの時期に出しとかないと普及に時間がかかりますし。AVXは特に文句とかは出てなかったけどSSEの時もMMXのほうが使えるなんて話もありましたし。
SSE の話は懐かしいですね。SSE 初版は NetBurst アーキテクチャーで x86 デコーダーが重すぎる Pentium 4 のために、レジスター長は MMX の倍だけれどレイテンシーも倍という、だいぶ辛い仕様でした。実質 SSE 1 命令で MMX を 2 回処理するような振る舞いでした。その後 NetBurst を捨てた Pentium M で MMX が SSE より高速に動いたりして、初期は本当に不遇でした。SSE が見直されたのは、Core シリーズで SSE 命令セットの仕様変更があって、レイテンシーが徐々に半減されたあたりからですね。Nehalem あたりでほとんどの SSE 命令セットが MMX の倍速で動くようになった印象です。ほんと懐かしいです。
SSE は Pentium III からだから NetBurst じゃないでしょ。NetBurst に初めて載ったのは SSE2。
MMXとの比較だしSIMD整数にのみに目が行って、単精度浮動小数点数のみの初代SSEをうっかり忘れていたんじゃない?
> Core シリーズで SSE 命令セットの仕様変更があって仕様変更なんてあった?実装方法の変更は(CPUアーキテクチャが変わると)あったかもしれんが
MMXは整数演算だけだから用途が限られると言われていたような気がする
実際SIMDなんていらんだろ。
SIMDがいる人もいらない人もいる。あなたやリナースはSIMDがいらない側の人間ってだけさ。そして私はSIMDがいる側の人間ってだけさ。
フリーランチの時代が終わった以上ソフトもハードも複雑になっていくほかないでしょうね。シンプルな実装でどんな時でも高速になんてのはもう無理。
いやハードはシンプルな並列でソフトのスケジューリングとかが大変とかも有り得るやも
初めはこんなもんですよ。
まずAVX512を実装する。今の時点ではハードが重すぎてそれほど性能が出ない。でもソフト開発は進められる。
次にプロセスが進歩して、使えるトランジスタ数が増えたら、AVX512を効率的に実行できる演算器を実装する。この時点でそこそこソフト開発は進んでるので、CPU出た時点で一気に性能が上がる。
大体の新命令はこの流れなので、今回もソフト設計者は味見だけして本番まってればいいかと。
使えないハードに向けて、誰がソフトを書くというのかw
性能が出ない、使えないと言われても特定の条件の時には性能が出る、十分に使い物になるとかだからな。AVX512も用途によっては全く使えないし、使える用途でもピーキーだけど使ったほうが性能がでる用途も普通にあるから、そのような用途のソフトを書く人はAVX512の使用を検討するだろう。
あなたではないことは確かですね。
これまでも同じ方式で、先に新命令実装してあとからパフォーマンス確保することをやってます。それを理解してる人は先取りして書きますよ。
例えば、x265なんかもAVX512の実装してます。今は+10%とか+20%の性能しか出ないけど、AVXの登場時だってそうだったし、いずれ改善することは明らかなので開発します。Intelのパートナーのベンダーだと、Intelからロードマップ示されて開発する場合も。
ゲームがAVX対応、配信ソフトがAVX512対応、この2つを同時に動かしたらクロックが下がってゲームのパフォーマンスが落ちる。全てのプログラムが新命令に対応するわけではないからねぇ・・・
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy
AVX512 って問題児だったのか (スコア:2, 参考になる)
Skylake-SP のラインナップがカオス [fc2.com]
AVX512は失敗作ではないか? [fc2.com]
発熱が凄くてクロック落ちる、メモリ律速になる、って AVX512 に対応する必要性を感じないですねぇ
Re: (スコア:0)
回路が大きいがゆえに発熱が大きくクロックが落ちるというのはSIMDの宿命なのでそれ言い出すとSIMDいらないってなる。
回路の最適化で将来的に発熱が小さくなればオッケー。
メモリ帯域がボトルネックということは言い換えればそこが早くなれば高速化できる。DDR5で1サイクル当たりの転送量が増えればボトルネックが解消されるかもしれない。
無理やり擁護してみたものの全体的には早すぎた感じですかね。
Re: (スコア:0)
早すぎるくらいの時期に出しとかないと普及に時間がかかりますし。
AVXは特に文句とかは出てなかったけどSSEの時もMMXのほうが使えるなんて話もありましたし。
Re: (スコア:0)
SSE の話は懐かしいですね。SSE 初版は NetBurst アーキテクチャーで x86 デコーダーが重すぎる Pentium 4 のために、レジスター長は MMX の倍だけれどレイテンシーも倍という、だいぶ辛い仕様でした。実質 SSE 1 命令で MMX を 2 回処理するような振る舞いでした。その後 NetBurst を捨てた Pentium M で MMX が SSE より高速に動いたりして、初期は本当に不遇でした。SSE が見直されたのは、Core シリーズで SSE 命令セットの仕様変更があって、レイテンシーが徐々に半減されたあたりからですね。Nehalem あたりでほとんどの SSE 命令セットが MMX の倍速で動くようになった印象です。ほんと懐かしいです。
Re: (スコア:0)
SSE は Pentium III からだから NetBurst じゃないでしょ。
NetBurst に初めて載ったのは SSE2。
Re: (スコア:0)
MMXとの比較だしSIMD整数にのみに目が行って、単精度浮動小数点数のみの初代SSEをうっかり忘れていたんじゃない?
Re: (スコア:0)
> Core シリーズで SSE 命令セットの仕様変更があって
仕様変更なんてあった?実装方法の変更は(CPUアーキテクチャが変わると)あったかもしれんが
Re: (スコア:0)
MMXは整数演算だけだから用途が限られると言われていたような気がする
Re: (スコア:0)
実際SIMDなんていらんだろ。
Re:AVX512 って問題児だったのか (スコア:1)
SIMDがいる人もいらない人もいる。
あなたやリナースはSIMDがいらない側の人間ってだけさ。
そして私はSIMDがいる側の人間ってだけさ。
Re: (スコア:0)
フリーランチの時代が終わった以上ソフトもハードも複雑になっていくほかないでしょうね。
シンプルな実装でどんな時でも高速になんてのはもう無理。
Re: (スコア:0)
いやハードはシンプルな並列でソフトのスケジューリングとかが大変とかも有り得るやも
Re: (スコア:0)
初めはこんなもんですよ。
まずAVX512を実装する。
今の時点ではハードが重すぎてそれほど性能が出ない。
でもソフト開発は進められる。
次にプロセスが進歩して、使えるトランジスタ数が増えたら、AVX512を効率的に実行できる演算器を実装する。
この時点でそこそこソフト開発は進んでるので、CPU出た時点で一気に性能が上がる。
大体の新命令はこの流れなので、今回もソフト設計者は味見だけして本番まってればいいかと。
Re: (スコア:0)
使えないハードに向けて、誰がソフトを書くというのかw
Re: (スコア:0)
性能が出ない、使えないと言われても特定の条件の時には性能が出る、十分に使い物になるとかだからな。
AVX512も用途によっては全く使えないし、使える用途でもピーキーだけど使ったほうが性能がでる用途も普通にあるから、そのような用途のソフトを書く人はAVX512の使用を検討するだろう。
Re: (スコア:0)
あなたではないことは確かですね。
これまでも同じ方式で、先に新命令実装してあとからパフォーマンス確保することをやってます。
それを理解してる人は先取りして書きますよ。
例えば、x265なんかもAVX512の実装してます。
今は+10%とか+20%の性能しか出ないけど、AVXの登場時だってそうだったし、いずれ改善することは明らかなので開発します。
Intelのパートナーのベンダーだと、Intelからロードマップ示されて開発する場合も。
Re: (スコア:0)
ゲームがAVX対応、配信ソフトがAVX512対応、この2つを同時に動かしたらクロックが下がってゲームのパフォーマンスが落ちる。
全てのプログラムが新命令に対応するわけではないからねぇ・・・