アカウント名:
パスワード:
AMD の狙いは、現状の 32ビットアーキテクチャと連続性を持たせ、しばらくは高性能な x86 として素早く普及を図りつつ、搭載し
ハード的にはただのメモリ間データ転送ですよね? であればCPUのレジスタのビット長やコアの内部バスのバス幅はあまり関係なくて、CPUの外部メモリバスのバス幅や速度で決まってくるのではないかと… で、すでにPentium以降のCPUは、外部バス幅は64ビットになってますので、あとはFSBの差しかないかと…
ん? んん? 何の話? OpteronはメモリコントローラをCPUに内臓してるから、FSBがどうたらとか無関係ではないの
>んで、ここでの話題は物理的なメモリ速度なんか全然関係無くて、CPU内部での論理的なメモリ操作の話をしているのではないかなと。
少なくとも普通のプログラム(SSEやVISみたいなSIMD命令群がメインで動かないようなプログラム)では、 64bitアドレス空間で動かしたほうがポインタのサイズが大きくなったり、 ページテーブルのキャッシュミスが増えたりするため、実行速度は遅くなります。
参考程度ですが、メモリコピーを行うプログラムを同一マシン上で 32/64bitアドレス空間それぞれで動かしたので、 結果を張り付けておきます [srad.jp]。
まあいずれにしろ、inline化したところで変化するのは関数コールのオーバヘッドの分だけのような気がするので、元々のメモリ転送速度の話とは切り放して考える必要があると思います。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ソースを見ろ -- ある4桁UID
一番乗りは誰だ (スコア:2, 参考になる)
AMD の狙いは、現状の 32ビットアーキテクチャと連続性を持たせ、しばらくは高性能な x86 として素早く普及を図りつつ、搭載し
の
Re:一番乗りは誰だ (スコア:1)
64ビット化すると、恩恵の出るアプリは除外してっ事ですけどね。
Re:一番乗りは誰だ (スコア:1)
身近なところで文字列のコピーなんかは普通に高速化できそう
体感できるかどうかは微妙だけど
恩恵のでないアプリはなさそうですよね
Re:一番乗りは誰だ (スコア:0)
もちろんアルゴリズムとかCPU内部でのcharの取り回しのアーキテクチャに拠るだろうし、体感できるほど差は無いだろうけど。
Re:一番乗りは誰だ (スコア:1)
実際のライブラリがどのような処理をしているかはわかりませんが…
ハード的にはただのメモリ間データ転送ですよね?
であればCPUのレジスタのビット長やコアの内部バスのバ
Re:一番乗りは誰だ (スコア:0)
ん? んん?
何の話? OpteronはメモリコントローラをCPUに内臓してるから、FSBがどうたらとか無関係ではないの
Re:一番乗りは誰だ (スコア:1)
>んで、ここでの話題は物理的なメモリ速度なんか全然関係無くて、CPU内部での論理的なメモリ操作の話をしているのではないかなと。
少なくとも普通のプログラム(SSEやVISみたいなSIMD命令群がメインで動かないようなプログラム)では、 64bitアドレス空間で動かしたほうがポインタのサイズが大きくなったり、 ページテーブルのキャッシュミスが増えたりするため、実行速度は遅くなります。
参考程度ですが、メモリコピーを行うプログラムを同一マシン上で 32/64bitアドレス空間それぞれで動かしたので、 結果を張り付けておきます [srad.jp]。
Re:一番乗りは誰だ (スコア:1)
Re:一番乗りは誰だ (スコア:1)
最適化を掛けていないので、memcpyとmemmoveの差がでない様な気がするのですが、いかがですか?
gccで下手に最適化掛けると、確かmemcpyとかはインライン展開されてしまうので、inline抑制有/無で結果出していただけるとありがたいです。
#お前がやれって?
#ごもっとも
Re:一番乗りは誰だ (スコア:1)
まあいずれにしろ、inline化したところで変化するのは関数コールのオーバヘッドの分だけのような気がするので、元々のメモリ転送速度の話とは切り放して考える必要があると思います。
Re:一番乗りは誰だ (スコア:1)
有意な差は出ていないようですね。
ありがとうございました。