アカウント名:
パスワード:
PC ベンチマーク [kyoto-u.ac.jp] なんてページを見ると Athron 950MHz で 750MFLOPS (0.75GFLOPS) なんて数字が出てる。性能比で10 倍強だけど、 スカラ vs ベクトルの割引と現在の最高クロックを考えると 数倍程度の性能比でしょうか。 SSE とかをブン回す根性があればもっと差が縮むかも。 うーむマイクロプロセッサ恐るべし。
さて、この家庭用スパコンってお買い得なのでしょうか。(^_^;)
%% スパコン屋さんも大変だろうなぁ。
しかし、 Apple のPowerPC G4 プロセッサの解説を読むと嘘だらけで腹が立つなぁ。
これまでのプロセッサが32ビットまたは64ビット単位で情報を処理していたのに比べ、PowerPC G4のVelocity Engineなら、128ビット 単位での処理が可能です。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日本発のオープンソースソフトウェアは42件 -- ある官僚
価格性能比はいかに (スコア:1)
PC ベンチマーク [kyoto-u.ac.jp] なんてページを見ると Athron 950MHz で 750MFLOPS (0.75GFLOPS) なんて数字が出てる。性能比で10 倍強だけど、 スカラ vs ベクトルの割引と現在の最高クロックを考えると 数倍程度の性能比でしょうか。 SSE とかをブン回す根性があればもっと差が縮むかも。 うーむマイクロプロセッサ恐るべし。
さて、この家庭用スパコンってお買い得なのでしょうか。(^_^;)
%% スパコン屋さんも大変だろうなぁ。
の
Re:価格性能比はいかに (スコア:2, 参考になる)
ここの紹介記事によるとPentium4/2GHzで4Gflops近い値 が出ているようです. やはり8Gflopsという値だけで比べると、かなりお高い印象 です.もちろんCPU以外の価格が支配的なのだと思いますが...
Re:価格性能比はいかに (スコア:2)
http://www.hpc.co.jp/IA-Products/P4Linux01-bench.htmなのもあります。
これ見ると、SX-5の8GFlops機と、Pen4の1.7Gの差は13倍くらいになっていますね。
データ転送速度が違う (スコア:1)
まだギガにも届かないパソコンと 比べられたら SX-6i が かわいそうです。
PCベンチマーク [kyoto-u.ac.jp] の flops.c を見ると、 「Athlon マシンで 750M FLOPS」 というデータは レジスタやL1キャッシュの中だけで閉じた 計算での 話のようです。
仮に 浮動小数点演算1回に 平均1回のストア演算が発生すると 266M Bytes / sizeof(double) = 33M。 CPU が無限に速くても 33M FLOPS になっちゃう。
コンタミは発見の母
確かに単純比較には、無理がありますね (スコア:1)
確かにそうでしょうね。
SX-6の1CPU、Max 8GFLOPS という数値も、ベクタープロセッサーのパイプラインが最高の状態での値だと考えられます。パイプラインの乱れ、ストアを考えると、やはり帯域で比較する必要もありますね。
やはり、最善のベンチマークは、実務で使用してみて判断するしかなさそうです。
Re:価格性能比はいかに (スコア:1)
PowerMacG4がピーク性能で11.8GFLOPSって言ってる [apple.co.jp]んですが、
これは何か間違ってます?
> さて、この家庭用スパコンってお買い得なのでしょうか。(^_^;)
1,800万円は家庭用って言えるんだろうか。。。
田舎なら家が買え…ないか。
[udon]
Re:価格性能比はいかに (スコア:1)
この資料にはピーク性能の根拠が載っていなのですが、 Velocity Engine を単精度浮動小数点(float) で使った場合のピーク性能を、 Dual CPU だから単純に 2倍してるのではと邪推しています。
ところで、 スーパーコンピュータの世界は 演算性能以上にメモリ性能が求められる世界ですから プロセッサがいくら速くても メモリアクセスのスループットやレイテンシーが 足を引っ張れば全然性能が出ません。 よく 「演算スループット:メモリスループット=1:1」 と言われます。
SX-6i では 8G :32G/sizeof(double) = 2:1
PowerMac G4 では 11.8G : 133M/sizeof(double) = 700 : 1。
PowerMac G4 でスパコンにやるような数値演算プログラムをやらせるとメモリスループットが完全にボトルネックになります。
おそらく SX-6i の 1/240 の性能しかでないと思われます。
p.s.
しかし、 Apple のPowerPC G4 プロセッサ [apple.co.jp] の解説を読むと嘘だらけで腹が立つなぁ。
コンタミは発見の母
PowerPC G4 (スコア:0)
具体的にどの変が嘘なのでしょう?
識者の意見をうかがいたいです。
Re:PowerPC G4 (スコア:1)
「スーパーコンピュータとは?」
すでに書いたように PowerPC G4 が 1G FLOPS 出ても、メモリバスの貧弱な PowerMac は High Performace Computing では使い物にならないと思われます。
カリフォルニア大学アーバイン校のAeneas Project を例にとって、5万ドルのスーパーコンピュータと Power Mac G4 を並べて書くのはナンセンスです。
「Velocity Engine」
`Pentium' と `Velocity Engine' の図を並べて と述べていますが、これがいただけません。 これを読むと「128ビット単位で演算できるのは PowerPC G4 が最初なんだ」という印象を受けますが、パソコン・ワークステーション用 CPU に限っても Pentium III の方が先にやっていました。
私の調べた範囲では、PowerPC G4 が出荷されたのは 1999年の第4四半期、Pentium III は 1999年の 1月から秋葉原に並んでいました。
プロセッサの詳細は双方ともに Microprocessor Forum 98 で発表されたはずですが、 SSE の方は AMD が 3D Now! を出してすぐに KNI という名前で予告だけぶっていましたね。
「競合製品との比較」
Intel の Pentium III (800MHz) と PowerPC G4(500MHz) を比較しています。 Pentium III 側は `Intel Signal Processing Library' という Web 公開のライブラリでのデータです。 しかし、 PowerPC G4側で動かしているプログラムが どこからやってきた記載がないです。 かなりアンフェアです。
ただ色々探しと PowerPC G4 for Engineering, Science, and Education 内に少し解説がありました。 どうも 等価となるように プログラムを作成したように読めます。
でも、 プログラムを公開していないので本当に等価か どうかは謎です。 入力データもどういうものを用いたのでしょうか?
結局、 G4(500MHz) の方が Pentium III(800MHz)より 2.20倍速いとい結論を出していますが、 これも眉つばです。
G4 の Pentium III に対するパフォーマンス比を 求めるのに、 ばらつきの大きい6つのプログラムの 算術平均を Pentium III と PowerPC G4 でそれぞれ求めて、 それらを単純に割るという計算をしているのです。 同じデータで調和平均で求めて割ると 1.34 倍になりました。 どちらが正しいと思います?
あと以下の文言には違和感を感じます
・「デュアルプロセッサ搭載の Power Mac G4 なら、その威力は 2 倍です。」(威力って何?)
・「G4の主な機能のひとつに、レジスタ内のデータの並べ替えが可能なベクトル変換機能」 (どの機能を指しているのか分らん?)
・「これは、科学の分野のスーパーコンピュータで採用されている、 128ビットベクター演算テクノロジーです。」(「128ビット」じゃないと駄目ですか?)
p.s.
文中にある「スーパーコンピュータ」は「ベクトル計算機」で置換すべきだと思います。
SuperComputer TOP 500 を見ても分るけど、今時のスーパーコンピュータの中にベクトル計算機は少ないです。
p.s. 2
SIMD ユニットを含めた浮動小数点演算能力のきちんと性能比較を行いたいのであれば、SPECfp とか NAS Parallel Benchmark もうよっと一般的なベンチマークを使うべきだと思います。 というか SPEC 値を公開せよ > APPLE
コンタミは発見の母
Re:価格性能比はいかに (スコア:1)
>1,800万円は家庭用って言えるんだろうか。。。
>田舎なら家が買え…ないか。
あるでしょう。
関西ローカルのテレビでやってた物件で、
3000坪家山畑田んぼ付きで1980万、
300坪(だったかな?)家倉付きで1200万、
ってのがありましたから。
(誤植無し)
はすかわ