パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

家庭向けサイズのスパコン」記事へのコメント

  • Max 8GFLOPS って今どきならどのくらいの性能なんだろう?

    PC ベンチマーク [kyoto-u.ac.jp] なんてページを見ると Athron 950MHz で 750MFLOPS (0.75GFLOPS) なんて数字が出てる。性能比で10 倍強だけど、 スカラ vs ベクトルの割引と現在の最高クロックを考えると 数倍程度の性能比でしょうか。 SSE とかをブン回す根性があればもっと差が縮むかも。 うーむマイクロプロセッサ恐るべし。

    さて、この家庭用スパコンってお買い得なのでしょうか。(^_^;)

    %% スパコン屋さんも大変だろうなぁ。

    --
    • by hikat (2344) on 2001年11月28日 21時47分 (#42130)
      自分はこの分野の専門じゃなく、P4だとどのくらいだろう と思ってWEB検索したところ、 www.hpc.co.jp/IA-Dev/IADEV-ATLAS.htm
      ここの紹介記事によるとPentium4/2GHzで4Gflops近い値 が出ているようです. やはり8Gflopsという値だけで比べると、かなりお高い印象 です.もちろんCPU以外の価格が支配的なのだと思いますが...
      親コメント
      • by take0m (4948) on 2001年11月28日 22時54分 (#42161) 日記
        NECの発表ですと、同一周波数でベクトルはスカラーの2倍程度の性能とのことです。あとは、体積の問題でしょうねぇ。がうしあんとかだと、Pen4の2Gで2GFlops程度だったと思ったので、8GFlopsだそうと思うと、8CPUでしょうか。Xeonなので、結構お高め。HPCは32CPUで70GFlopsのマシンがMAXだったような気がしました。

        http://www.hpc.co.jp/IA-Products/P4Linux01-bench.htmなのもあります。

        これ見ると、SX-5の8GFlops機と、Pen4の1.7Gの差は13倍くらいになっていますね。
        親コメント
    • SX-6i は主記憶との間の帯域が 32G Bytes/sec。
      まだギガにも届かないパソコンと 比べられたら SX-6i が かわいそうです。

      PCベンチマーク [kyoto-u.ac.jp] の flops.c を見ると、 「Athlon マシンで 750M FLOPS」 というデータは レジスタやL1キャッシュの中だけで閉じた 計算での 話のようです。
      仮に 浮動小数点演算1回に 平均1回のストア演算が発生すると 266M Bytes / sizeof(double) = 33M。 CPU が無限に速くても 33M FLOPS になっちゃう。
      --
      コンタミは発見の母
      親コメント
      • >データはレジスタやL1キャッシュの中だけで閉じた計算での話のようです。

        確かにそうでしょうね。
        SX-6の1CPU、Max 8GFLOPS という数値も、ベクタープロセッサーのパイプラインが最高の状態での値だと考えられます。パイプラインの乱れ、ストアを考えると、やはり帯域で比較する必要もありますね。

        やはり、最善のベンチマークは、実務で使用してみて判断するしかなさそうです。
        親コメント
    • > Max 8GFLOPS って今どきならどのくらいの性能なんだろう?

      PowerMacG4がピーク性能で11.8GFLOPSって言ってる [apple.co.jp]んですが、
      これは何か間違ってます?

      > さて、この家庭用スパコンってお買い得なのでしょうか。(^_^;)

      1,800万円は家庭用って言えるんだろうか。。。
      田舎なら家が買え…ないか。
      --
      [udon]
      親コメント
      • ピーク性能 11.8G FLOPS と言っているのは こっちのPDF [apple.co.jp]ですね。
        この資料にはピーク性能の根拠が載っていなのですが、 Velocity Engine を単精度浮動小数点(float) で使った場合のピーク性能を、 Dual CPU だから単純に 2倍してるのではと邪推しています。

        ところで、 スーパーコンピュータの世界は 演算性能以上にメモリ性能が求められる世界ですから プロセッサがいくら速くても メモリアクセスのスループットやレイテンシーが 足を引っ張れば全然性能が出ません。 よく 「演算スループット:メモリスループット=1:1」 と言われます。
        SX-6i では 8G :32G/sizeof(double) = 2:1
        PowerMac G4 では 11.8G : 133M/sizeof(double) = 700 : 1。
        PowerMac G4 でスパコンにやるような数値演算プログラムをやらせるとメモリスループットが完全にボトルネックになります。
        おそらく SX-6i の 1/240 の性能しかでないと思われます。

        p.s.

        しかし、 Apple のPowerPC G4 プロセッサ [apple.co.jp] の解説を読むと嘘だらけで腹が立つなぁ。
        --
        コンタミは発見の母
        親コメント
        • by Anonymous Coward
          しかし、 Apple のPowerPC G4 プロセッサの解説を読むと嘘だらけで腹が立つなぁ。

          具体的にどの変が嘘なのでしょう?
          識者の意見をうかがいたいです。
          • 私は以下の部分が嘘 あるいは 妙だと思います。

            「スーパーコンピュータとは?」
            すでに書いたように PowerPC G4 が 1G FLOPS 出ても、メモリバスの貧弱な PowerMac は High Performace Computing では使い物にならないと思われます。
            カリフォルニア大学アーバイン校のAeneas Project を例にとって、5万ドルのスーパーコンピュータと Power Mac G4 を並べて書くのはナンセンスです。

            「Velocity Engine」
            `Pentium' と `Velocity Engine' の図を並べて
            これまでのプロセッサが32ビットまたは64ビット単位で情報を処理していたのに比べ、PowerPC G4のVelocity Engineなら、128ビット 単位での処理が可能です。
            と述べていますが、これがいただけません。 これを読むと「128ビット単位で演算できるのは PowerPC G4 が最初なんだ」という印象を受けますが、パソコン・ワークステーション用 CPU に限っても Pentium III の方が先にやっていました。
            私の調べた範囲では、PowerPC G4 が出荷されたのは 1999年の第4四半期、Pentium III は 1999年の 1月から秋葉原に並んでいました。
            プロセッサの詳細は双方ともに Microprocessor Forum 98 で発表されたはずですが、 SSE の方は AMD が 3D Now! を出してすぐに KNI という名前で予告だけぶっていましたね。

            「競合製品との比較」
            Intel の Pentium III (800MHz) と PowerPC G4(500MHz) を比較しています。 Pentium III 側は `Intel Signal Processing Library' という Web 公開のライブラリでのデータです。 しかし、 PowerPC G4側で動かしているプログラムが どこからやってきた記載がないです。 かなりアンフェアです。
            ただ色々探しと PowerPC G4 for Engineering, Science, and Education 内に少し解説がありました。 どうも 等価となるように プログラムを作成したように読めます。
            でも、 プログラムを公開していないので本当に等価か どうかは謎です。 入力データもどういうものを用いたのでしょうか?


            結局、 G4(500MHz) の方が Pentium III(800MHz)より 2.20倍速いとい結論を出していますが、 これも眉つばです。
            G4 の Pentium III に対するパフォーマンス比を 求めるのに、 ばらつきの大きい6つのプログラムの 算術平均を Pentium III と PowerPC G4 でそれぞれ求めて、 それらを単純に割るという計算をしているのです。 同じデータで調和平均で求めて割ると 1.34 倍になりました。 どちらが正しいと思います?


            あと以下の文言には違和感を感じます
            ・「デュアルプロセッサ搭載の Power Mac G4 なら、その威力は 2 倍です。」(威力って何?)
            ・「G4の主な機能のひとつに、レジスタ内のデータの並べ替えが可能なベクトル変換機能」 (どの機能を指しているのか分らん?)
            ・「これは、科学の分野のスーパーコンピュータで採用されている、 128ビットベクター演算テクノロジーです。」(「128ビット」じゃないと駄目ですか?)

            p.s.
            文中にある「スーパーコンピュータ」は「ベクトル計算機」で置換すべきだと思います。
            SuperComputer TOP 500 を見ても分るけど、今時のスーパーコンピュータの中にベクトル計算機は少ないです。

            p.s. 2
            SIMD ユニットを含めた浮動小数点演算能力のきちんと性能比較を行いたいのであれば、SPECfp とか NAS Parallel Benchmark もうよっと一般的なベンチマークを使うべきだと思います。 というか SPEC 値を公開せよ > APPLE
            --
            コンタミは発見の母
            親コメント
      • こんなところにレスつけて申し訳ないですが。

        >1,800万円は家庭用って言えるんだろうか。。。
        >田舎なら家が買え…ないか。

        あるでしょう。
        関西ローカルのテレビでやってた物件で、
        3000坪家山畑田んぼ付きで1980万、
        300坪(だったかな?)家倉付きで1200万、
        ってのがありましたから。
        (誤植無し)
        --
        はすかわ
        親コメント

日本発のオープンソースソフトウェアは42件 -- ある官僚

処理中...