アカウント名:
パスワード:
4gmaer のレビューでは、> L2キャッシュを超える「4MB Range」以降で,Ryzen 7 1800Xの遅延状況が際立って悪化していることだ。> FX-9590より遅いというのは異常であり,正直,「キャッシュアクセスやメモリアクセス周りの最適化が十分でない」可能性が> 極めて高いのではないかと危惧しているが
で終わってしまっていますが、PC Watch のレビューでは補足があり> AMDによるとSandraやAIDA64などのベンチマークソフトでは、ZENマイクロアーキテクチャのキャッシュ帯域を適切に> 測定できないとしており、独自に測定した結果が案内された。
ということで(どうい
今回のRyzenでは、キャッシュの先読みにニューラルネットワークを応用した学習機能を持たせてるようで、ある程度コードを走らせ続けると、学習結果に基づく予測でプリフェッチ元を決めてるようなんですよね。
http://www.amd.com/en-gb/innovations/software-technologies/zen-cpu#neuralnet [amd.com]
当然、ハードウェアだけでは実現できないでしょうから、マイクロコードのアルゴリズムや重み付け変数のチューニングで、伸びしろが相当あったということじゃないですかね。流石に、ここから更に、今の50%分パフォーマンスを上げるとかいうのは難しいでしょうけど。
>当然、ハードウェアだけでは実現できないでしょうから、
パーセプトロンって黎明期はむしろ回路でガチ組み実装してませんでしたっけ?ソフトウェア実装の方が後から出てきた発想だったように思います。
役割上、速さを求められる部分なのでマイクロコードなんかを咀嚼している暇は無いかもしれません。むしろ最初期の発想に立ち返ってアルゴリズム部分に関しては、ほぼほぼハードウェア実装したんじゃないかな?と想像しました。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人はmoriwaka -- Anonymous Coward
キャッシュレイテンシについて補足 (スコア:4, 参考になる)
4gmaer のレビューでは、
> L2キャッシュを超える「4MB Range」以降で,Ryzen 7 1800Xの遅延状況が際立って悪化していることだ。
> FX-9590より遅いというのは異常であり,正直,「キャッシュアクセスやメモリアクセス周りの最適化が十分でない」可能性が
> 極めて高いのではないかと危惧しているが
で終わってしまっていますが、PC Watch のレビューでは補足があり
> AMDによるとSandraやAIDA64などのベンチマークソフトでは、ZENマイクロアーキテクチャのキャッシュ帯域を適切に
> 測定できないとしており、独自に測定した結果が案内された。
ということで(どうい
Re: (スコア:1)
今回のRyzenでは、キャッシュの先読みにニューラルネットワークを応用した学習機能を持たせてるようで、ある程度コードを走らせ続けると、学習結果に基づく予測でプリフェッチ元を決めてるようなんですよね。
http://www.amd.com/en-gb/innovations/software-technologies/zen-cpu#neuralnet [amd.com]
当然、ハードウェアだけでは実現できないでしょうから、マイクロコードのアルゴリズムや重み付け変数のチューニングで、伸びしろが相当あったということじゃないですかね。
流石に、ここから更に、今の50%分パフォーマンスを上げるとかいうのは難しいでしょうけど。
Re:キャッシュレイテンシについて補足 (スコア:0)
>当然、ハードウェアだけでは実現できないでしょうから、
パーセプトロンって黎明期はむしろ回路でガチ組み実装してませんでしたっけ?
ソフトウェア実装の方が後から出てきた発想だったように思います。
役割上、速さを求められる部分なのでマイクロコードなんかを咀嚼している暇は無いかもしれません。
むしろ最初期の発想に立ち返ってアルゴリズム部分に関しては、ほぼほぼハードウェア実装したんじゃないかな?と想像しました。