アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson
並列化効率 (スコア:2, 興味深い)
Photoshopの重い処理とかレンダリングとかだと、CPUコア間でメモリアクセスの取り合いになって、全然速くならないんじゃないか、という気もします。
AppleのwebによるとQuad Xeonは
> 8MB共有L2キャッシュ(各プロセッサ)(計16MB; 2つのプロセッサコアで4MBを共有)
とのことなので、少なくとも2つのCPUコアではキャッシュも取りあいになって、重いアプリほど案外速くならない(特に5個目のプロセスから)、ということになりはしないかと心配になります。
Re:並列化効率 (スコア:2, 参考になる)
メモリアクセス中心で重いのであれば8コアになったとしても性能は向上しないかもしくは逆に下がりますが、計算が中心であれば性能向上の可能性はあります。ただ、8コアをフルに生かすためにはソフト側も最適化しないと現状のままでは宝の持ち腐れであることも事実。
例に出された
>Photoshopの重い処理とかレンダリングとか
の場合、処理内容からして十分な並列化が可能でむしろGPUにやらせるべきことであり8コアになると律速はメモリ帯域なる可能性は十分にあります。
フル構成にした場合DDR2 667MHzのFB-DIMMでメモリチャンネルが独立して4つらしいので単純計算して10.6GB/sec。FSBは1.33GHz、64bitのものが各CPUごとに独立して計2本なので単純計算して約10.6GB/sec。といってもFSBの帯域を足す意味はない上に、メモリも4つのモジュールに1つのコアが同時にアクセスすることはできないだろうからメモリ帯域としては5.3GB/secとするのが妥当だと思われる。
この帯域がどう響いてくるか、こればかりは走らせて見ないことにはわからないかと。
もっともソフト側の最適化がうまくできず律速がメモリ帯域になるところまで性能があげれない可能性のほうが大きいですが。
Re:並列化効率 (スコア:2, 参考になる)
それよりコア数が増えたときの性能の方に興味を持った所でした。
Opteron 向けの M/B では、値段がだいぶ違いますが 8ソケット 16core も存在しているので、
8core 同士でベンチマークとか見てみたい所です。