パスワードを忘れた? アカウント作成
1887052 journal
日記

t-nissieの日記: 【電脳】feram-0.18.05の並列化率、並列効果の図ができたよ 3

日記 by t-nissie

フリーソフトウエアの強誘電体シミュレータferam-0.18.05並列化率、並列効果の図があがったよ。
SR11000では99%以上の並列化率なんだけど、自動並列化がないgfortranでの並列化率はまだ80%。
使っているのはFortranとOpenMP。

(2012-03-03 Made plot lines thicker.)

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by tamanegi (38323) on 2012年03月01日 16時00分 (#2109211) 日記

    Xeon でも ifort 使えば SR11000 に近い効率が出るってことですか?
    自動並列化って結構すごいんですね。感想の方向性が間違っていてすいません。

    # もう MD のプログラムは自分で書か(け?)ないけど ID
    # GPU が爆速すぎて泣ける。Xeon 32 並列より圧倒的に速いってどうよ…

    ところで新しい図の線はもう少し太くされたほうがいいんじゃないかと…。

    • コメントありがとうございます。

      自動並列化はバカです。ディレクティブを
      入れたりかなり努力しないと並列化率99%
      にはいきません。

      グラフのXeon X5690のプロットは
      gfortran-4.4 + FFTW-3.3.1 です。

      ifortの場合、自動並列化はあるのですが、
      いまのところMKLのFFTWの関数のラッパ
      を使っているので、FFTのところが遅く
      なってしまうようです。ifort+FFTWなら
      より速く計算できると思うのですが、
      面倒なのとユーザの利便性を考えて
      いまのところそうする予定はありません。

      GPUは使い始めたところです。プログラ
      ミングが面倒ですし、複雑な処理には向
      いていない印象を持ちました。しかしGPU
      の応用は時代の流れなので対応はしていく
      つもりです。

      グラフの線は太くします。GNUPLOTを
      使っています。
      --
      love && peace && free_software
      t-nissie
      親コメント
      • by tamanegi (38323) on 2012年03月01日 17時40分 (#2109304) 日記

        丁寧にありがとうございます。

        > 自動並列化はバカです。ディレクティブを入れたりかなり努力しないと

        あぁやっぱり。でも omp のディレクティブとかを自分でいれる場合は自動並列化とは呼ばないんじゃ、と思わなくもないです。

        自分はバイオとかのほうの MD かじってますけど、一部のパッケージではどうも GPU で Particle Mesh Ewald をごく普通に動かしているんですよね。自分も CUDA を見たときに

        > プログラミングが面倒ですし、複雑な処理には向いていない印象を持ちました。

        という印象をもったのですが、できる人にはやっぱりできてしまうみたいですね。feram の中身は全くもってわからないのですが(すいません)、やはり GPU で動かすための最大のネックは PME や PPPM での、特に逆格子のところの処理でしょうか。j はまだしも歪みとかの弾性体的(?)なところも面倒な処理がありそうで色々と大変そうですね。

        親コメント
typodupeerror

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

読み込み中...