アカウント名:
パスワード:
NVIDIA Quadro GV100 NVQGV100-32GHBM2 [PCIExp 32GB]が1,592,965円(本日時点価格コム調べ)だから、結局の所性能次第。
結局の所、マイニングやってどっちが効率いいのか?以外、市場は興味ないやろな。
コンテストのところに「C,C++,Fortran」とあるから、純粋にCで書かれたプログラムならソースをAX-Aurora用コンパイラに突っ込めんでとりあず動くのかね。
APIで提供すりゃいいものを。
もともとダメじゃないかな
大得意先の地球シミュレーターでは、ベクターエンジンとは別にGPUのノード群を用意しているとおり、求める性能の方向がちがう。https://www.jamstec.go.jp/es/jp/system/system.html [jamstec.go.jp]https://srad.jp/story/21/03/10/1632233/ [srad.jp]
コンパイラは
NECは、C/C++/Fortranなどの汎用プログラミング言語で書かれたプログラムをベクトル演算用に自動的に最適化する独自のコンパイラも提供しており
だそうですhttps://jpn.nec.com/press/202011/20201119_01.html [nec.com]
浮動小数点演算の性能に特化してるからマイニングなんかやっても性能でないよ。「Cで書かれたプログラム」とか書いとけば専門家気取りできると思ってる?
bfloat16とか使えるんですかあと1BitのINTがコンパイラで標準対応かとかも大事らしい。
当然APIはあるよ。あたりまえ。でも、いわゆる一般的な意味での「API」のような疎結合ではスパコンで動かす科学技術計算処理の記述は面倒なので、言語レベルで対応したものでないと使ってられない。
そういう言語コンパイラレベルで対応してるのがC/C++/Fortran、ということ。ざっくり言えば、for (i = 0; i < 100; i++) { a[i] = b[i] + c[i]; }みたいなループ演算を、ベクトルプロセッサではループではなくベクトル演算にしたり、スカラープロセッサでは少数回数ずつ複数のプロセッサで分担したり、といった最適化をしてくれる。
最適
CUDAが動かないだけで見込み客の7割位にそっぽ向かれる気はする。
そっちは最初から見込んでないんじゃないか。見込み客は既存顧客のリプレースだけだろう。新規客を拡販する意思が欠片も見られない。
そういう汎用的なライブラリで動けば面白いと思うんだけどもしくは汎用的なライブラリ作って広げる努力してればと思ったけどそれ日本企業の苦手なことかもねwそんなこと出来てればもっと成功してる企業多そう
>演算自体は「並列演算対応のライブラリ」に任せられるような定番処理でプログラムはそれを呼び出すだけCUDAやらOpenCLは結局これで、似たようなものがないと売れないやろなぁと。(理解間違ってるかな?)
「ベクトルコンピュータに合わせてソースを最適化できる人材」相手にビジネスしてても失敗するよね。
CUDA書かなくてもコンパイラが自動的にオフロードしてくれるというところにメリットがあるんじゃよOpenMPより手軽かつ同程度の性能向上で、専用デバイスにオフロードしてくれるんじゃ
CUDAは版OpenMPたるpenACCというお手軽なものがあるが、あれ結局3割ぐらいしか性能でんのじゃ。あれでGPU化するならばCUDA命令をばりばり使ったほうがマシなレベル。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy
マイニング効率よいの? (スコア:0)
NVIDIA Quadro GV100 NVQGV100-32GHBM2 [PCIExp 32GB]が1,592,965円(本日時点価格コム調べ)だから、結局の所性能次第。
結局の所、マイニングやってどっちが効率いいのか?以外、市場は興味ないやろな。
コンテストのところに「C,C++,Fortran」とあるから、純粋にCで書かれたプログラムならソースをAX-Aurora用コンパイラに突っ込めんでとりあず動くのかね。
APIで提供すりゃいいものを。
Re:マイニング効率よいの? (スコア:1)
もともとダメじゃないかな
大得意先の地球シミュレーターでは、ベクターエンジンとは別にGPUのノード群を用意しているとおり、求める性能の方向がちがう。
https://www.jamstec.go.jp/es/jp/system/system.html [jamstec.go.jp]
https://srad.jp/story/21/03/10/1632233/ [srad.jp]
コンパイラは
NECは、C/C++/Fortranなどの汎用プログラミング言語で書かれたプログラムをベクトル演算用に自動的に最適化する独自のコンパイラも提供しており
だそうです
https://jpn.nec.com/press/202011/20201119_01.html [nec.com]
Re: (スコア:0)
浮動小数点演算の性能に特化してるからマイニングなんかやっても性能でないよ。
「Cで書かれたプログラム」とか書いとけば専門家気取りできると思ってる?
Re: (スコア:0)
bfloat16とか使えるんですかあと1BitのINTがコンパイラで標準対応かとかも大事らしい。
Re: (スコア:0)
当然APIはあるよ。あたりまえ。
でも、いわゆる一般的な意味での「API」のような疎結合では
スパコンで動かす科学技術計算処理の記述は面倒なので、
言語レベルで対応したものでないと使ってられない。
そういう言語コンパイラレベルで対応してるのがC/C++/Fortran、ということ。
ざっくり言えば、
for (i = 0; i < 100; i++) { a[i] = b[i] + c[i]; }
みたいなループ演算を、
ベクトルプロセッサではループではなくベクトル演算にしたり、
スカラープロセッサでは少数回数ずつ複数のプロセッサで分担したり、
といった最適化をしてくれる。
最適
Re: Re:マイニング効率よいの? (スコア:1)
CUDAが動かないだけで見込み客の7割位にそっぽ向かれる気はする。
Re: (スコア:0)
そっちは最初から見込んでないんじゃないか。
見込み客は既存顧客のリプレースだけだろう。
新規客を拡販する意思が欠片も見られない。
Re: (スコア:0)
そういう汎用的なライブラリで動けば面白いと思うんだけど
もしくは汎用的なライブラリ作って広げる努力してれば
と思ったけどそれ日本企業の苦手なことかもねw
そんなこと出来てればもっと成功してる企業多そう
Re: (スコア:0)
>演算自体は「並列演算対応のライブラリ」に任せられるような定番処理でプログラムはそれを呼び出すだけ
CUDAやらOpenCLは結局これで、似たようなものがないと売れないやろなぁと。
(理解間違ってるかな?)
「ベクトルコンピュータに合わせてソースを最適化できる人材」相手にビジネスしてても失敗するよね。
Re: (スコア:0)
CUDA書かなくてもコンパイラが自動的にオフロードしてくれるというところにメリットがあるんじゃよ
OpenMPより手軽かつ同程度の性能向上で、専用デバイスにオフロードしてくれるんじゃ
CUDAは版OpenMPたるpenACCというお手軽なものがあるが、あれ結局3割ぐらいしか性能でんのじゃ。あれでGPU化するならばCUDA命令をばりばり使ったほうがマシなレベル。