アカウント名:
パスワード:
ではLINPACKについてはどうか、ですよね。
資料のp.6から1台でのスコアが書いてありますが、 たとえばSX-6のシングルプロセッサでは TPP Best Effort/Theoritical Peakが95%くらいですから、 ベクトル1プロセッサにオプションつけてコンパイルする程度だと それくらいになるような問題ってことですね。 チューニングを頑張るともっと上がるんでしょうけど。
リストにはG5の1プロセッサのベンチマーク結果はないけど、 AltiVecの効果の参考になるのは、 pSeries690Turboの56%とか、 Pent
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー
効率 (スコア:2, 参考になる)
単
Re:効率 (スコア:1)
> 状況がそもそも夢みたいな事なんだから、むしろ48.3%はG5が64bitで動いて
> いることを考えるとぴったりの数字なような気が。
書いてある意味がよく分からないのですが、夢みたいな事というのは
どういう事でしょうか?
ベクトル演算が効くかどうかは、プログラムに依るわけで、
ベクトル化に適したプログラム(流体計算とか)なら
ベクトル化率99%とかは普通です。
それにベ
Re:効率 (スコア:0)
実測値と理論値が同等なんて、ほとんどありえない話ですがね。
Re:効率 (スコア:3, 参考になる)
ではLINPACKについてはどうか、ですよね。
資料のp.6から1台でのスコアが書いてありますが、 たとえばSX-6のシングルプロセッサでは TPP Best Effort/Theoritical Peakが95%くらいですから、 ベクトル1プロセッサにオプションつけてコンパイルする程度だと それくらいになるような問題ってことですね。 チューニングを頑張るともっと上がるんでしょうけど。
リストにはG5の1プロセッサのベンチマーク結果はないけど、 AltiVecの効果の参考になるのは、 pSeries690Turboの56%とか、 Pent
Re:効率 (スコア:2, 参考になる)
PowerPC 970 や Pentium 4 は浮動少数点演算の演算器が 2つあり、それらのスループットは 1命令/cycle。2つの演算器を完全に埋めることができれば、2命令/cycle の浮動小数点演算命令を実行できます。
(注1: Pentium 4 の場合は、この場合、命令と言ってもμop)
(注2: PowerPC 970 の場合、積和演算によって 2命令/cycle → 4演算/cycle)
この際、演算器をフルに埋める
Re:効率 (スコア:1)
一般にSIMD命令はSIMD専用の演算器を使うので、あまりに的外れですね。
>飽くまで演算器をフル稼動させるに足るだけのスループットでもって演算を指示するための手段
それを目的としているのはSIMDではなくて、HyperThreadingだと思いますが。
[tomoyu-n]
Re:効率 (スコア:1)
少なくとも Pentium 4 プロセッサでは、浮動小数点のスカラ演算 (x87) 命令と、SSE/SSE2 での浮動小数点演算で、演算器 (adderとかmultiplier) は共用ですヨ。