アカウント名:
パスワード:
Xeon でも ifort 使えば SR11000 に近い効率が出るってことですか?自動並列化って結構すごいんですね。感想の方向性が間違っていてすいません。
# もう MD のプログラムは自分で書か(け?)ないけど ID# GPU が爆速すぎて泣ける。Xeon 32 並列より圧倒的に速いってどうよ…
ところで新しい図の線はもう少し太くされたほうがいいんじゃないかと…。
丁寧にありがとうございます。
> 自動並列化はバカです。ディレクティブを入れたりかなり努力しないと
あぁやっぱり。でも omp のディレクティブとかを自分でいれる場合は自動並列化とは呼ばないんじゃ、と思わなくもないです。
自分はバイオとかのほうの MD かじってますけど、一部のパッケージではどうも GPU で Particle Mesh Ewald をごく普通に動かしているんですよね。自分も CUDA を見たときに
> プログラミングが面倒ですし、複雑な処理には向いていない印象を持ちました。
という印象をもったのですが、できる人にはやっぱりできてしまうみたいですね。feram の中身は全くもってわからないのですが(すいません)、やはり GPU で動かすための最大のネックは PME や PPPM での、特に逆格子のところの処理でしょうか。j はまだしも歪みとかの弾性体的(?)なところも面倒な処理がありそうで色々と大変そうですね。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stableって古いって意味だっけ? -- Debian初級
ということは (スコア:1)
Xeon でも ifort 使えば SR11000 に近い効率が出るってことですか?
自動並列化って結構すごいんですね。感想の方向性が間違っていてすいません。
# もう MD のプログラムは自分で書か(け?)ないけど ID
# GPU が爆速すぎて泣ける。Xeon 32 並列より圧倒的に速いってどうよ…
ところで新しい図の線はもう少し太くされたほうがいいんじゃないかと…。
Re: (スコア:1)
自動並列化はバカです。ディレクティブを
入れたりかなり努力しないと並列化率99%
にはいきません。
グラフのXeon X5690のプロットは
gfortran-4.4 + FFTW-3.3.1 です。
ifortの場合、自動並列化はあるのですが、
いまのところMKLのFFTWの関数のラッパ
を使っているので、FFTのところが遅く
なってしまうようです。ifort+FFTWなら
より速く計算できると思うのですが、
面倒なのとユーザの利便性を考えて
いまのところそうする予定はありません。
GPUは使い始めたところです。プログラ
ミングが面倒ですし、複雑な処理には向
いていない印象を持ちました。しかしGPU
の応用は時代の流れなので対応はしていく
つもりです。
グラフの線は太くします。GNUPLOTを
使っています。
love && peace && free_software
t-nissie
Re:ということは (スコア:1)
丁寧にありがとうございます。
> 自動並列化はバカです。ディレクティブを入れたりかなり努力しないと
あぁやっぱり。でも omp のディレクティブとかを自分でいれる場合は自動並列化とは呼ばないんじゃ、と思わなくもないです。
自分はバイオとかのほうの MD かじってますけど、一部のパッケージではどうも GPU で Particle Mesh Ewald をごく普通に動かしているんですよね。自分も CUDA を見たときに
> プログラミングが面倒ですし、複雑な処理には向いていない印象を持ちました。
という印象をもったのですが、できる人にはやっぱりできてしまうみたいですね。feram の中身は全くもってわからないのですが(すいません)、やはり GPU で動かすための最大のネックは PME や PPPM での、特に逆格子のところの処理でしょうか。j はまだしも歪みとかの弾性体的(?)なところも面倒な処理がありそうで色々と大変そうですね。