![スパコン スパコン](https://srad.jp/static/topics/supercomputing_64.png)
スパコン「京」、共益勾配法ベースのベンチマークテストで世界1位を獲得 40
別の指標 部門より
理化学研究所(理研)と富士通は11月16日、「HPCG(High Performance Conjugate Gradient)ベンチマーク」ランキングの2016年11月版において「京」が世界第1位を獲得したと発表した(マイナビニュース)。
HPCGランキングはスーパーコンピュータに関する国際会議「SC16」において発表されたもので、産業利用など実際のアプリケーションで用いられる「共役勾配法」の処理速度を基準に性能を測定するもの。
スーパーコンピュータの性能評価基準としては「TOP500」が有名だが、TOP500では「LINPACK」という、線形代数演算を行うライブラリを元にしたベンチマークプログラム(HPL)を使って性能を評価している。HPCGはLINPACKベンチマークを補完することを意図しており、「HPLで使われる計算やデータアクセスパターンは今でもいくつかのスケーラブルなアプリケーションにおいて重要な指標となっている」としつつも、それとは異なるアプリケーション分野で使われる処理に対するベンチマークを提供するという。
今回のベンチマークテストでは京が持つ全計算ノード(8万2944台)が用いられており、逐次実行していた演算を同時実行させることで単位時間当たりの演算回数を増やしているという。このチューニングによって選出2014年の最初のランキング発表時よりも高い602TFLOPSというスコアを達成したそうだ。
なお、ランキング2位は中国の「天河2号」、3位は2016年11月版のTOP500で京を抜いて日本最高性能を達成した東大/筑波大の「Oakforest-PACS」、4位は最新のTOP500で1位の「神威太湖之光」、5位も米国立エネルギー研究科学計算センター(NERSC)が2016年に稼動を開始させた次世代スパコン「Cori」と、いずれも京よりもLINPACK性能が上のスパコンとなっている。
「共益」も「きょうえき」も間違い (スコア:3, 参考になる)
正しくは「共役」で読みは「きょうやく」です
共役を「きょうえき」と誤読してそれを変換すると「共益」になりますが
共益勾配法なんて存在しません
Re:「共益」も「きょうえき」も間違い (スコア:2, 参考になる)
共軛で覚えておけば間違うことはないのであります.
常用漢字など知ったことか.
Re:「共益」も「きょうえき」も間違い (スコア:1)
いつも巾ではなく冪を使うけど、さすがに軛は使わないなぁ。
Re: (スコア:0)
もともと軛にあった「対になる」という意味が通じなくなってしまったことも問題。軛という字になったのはおそらくconjugateの直訳なので、これを音を無理やり別字で当てはめて残すより、別の用語を作ったほうが良かったのでは?
とはいえ、コンジュゲートってカタカナにするだけとか、頭文字だけならべてCGMよりは意味がわかりやすいけど…
Re:「共益」も「きょうえき」も間違い (スコア:1)
記事本文は元ネタからコピペしたのにタイトルは自分で打ったから間違えたんだな。
the.ACount
Re: (スコア:0)
hylomは学校で共役複素数なんて習ったことがないんだろう。
# とすると中卒か?
Re:「共益」も「きょうえき」も間違い (スコア:1)
飛び級したり卒業(含む見込み)を待たずに入学資格を得て上の学校に進学した
というむしのいい方向のシナリオもあっていいのではないだろうか。
Re: (スコア:0)
ずっとイギリスで暮らしていて、最近日本にやってきた金髪美少女の可能性が
#きんモザの映画は劇場で見るOVAと思えばいい出来だった
Re: (スコア:0)
なぜタレこみにない部分をわざわざ付け足し、なぜよりにもよってそこで間違えるのか?
Re: (スコア:0)
hylomはコーディングの間違えも直さない。誰かにやらせるんだよ。
共役勾配法は行列積もなく,単純だから逆に速かったのかな (スコア:2)
共役勾配法は,行列とベクトルの掛け算も不要です。
ベクトルとベクトルの和,スカラー積,内積で済んでしまうから,メモリアクセスの速さが効いたということではないでしょうか。
GPU系は,GPUへのデータの配分とその結果を集めるところがボトルネックになったのでしょうか。
Re:共役勾配法は行列積もなく,単純だから逆に速かったのかな (スコア:1)
行列とベクトルの積が不要な共役勾配法って使い物になるんかな?
共役勾配法で標準的な準ニュートン法では積が必要だし…
the.ACount
Re: (スコア:0)
係数の行列はどこへいっただば…?
Re: (スコア:0)
> 共役勾配法は,行列とベクトルの掛け算も不要です。
いろいろ勘違いしてますよ
まず掛け算は必要です
https://ja.wikipedia.org/wiki/%E5%85%B1%E5%BD%B9%E5%8B%BE%E9%85%8D%E6%B3%95 [wikipedia.org]
ここの例だと,行列Aとベクトルa_k 及び p_kの積が複数回必要です
次に,内積は,行列とベクトルの掛け算の特殊な形で,1行N列の行列とN次元ベクトルの積です
言い換えると,内積を繰り返せば行列の積が得られます
ですから「行
Re:共役勾配法は行列積もなく,単純だから逆に速かったのかな (スコア:2)
F(x) を最小化するとします。
1. x_1 : 初期値
s_1 : - gradient of F at x_1
k = 1;
2. || gradient of F at x_k || が十分小さければ終了。
3. F(x_k + alpha_k s_k) で線形探索して,alpha_kを求める。
x_{k+1} = x_k + alpha_k s_k
4. lambda_k = || gradient of F at x_{k+1} ||^2 / || gradient of F at x_k ||^2
(Fletcher Reeves を使う場合)
5. s_{k+1} = - gradient of F at x_{k+1} + lambda_k s_k
6. k = k + 1, go to 2.
ですので,一般には行列とベクトルの掛け算は不要です。
Wikipediaでは,F(x)が2次関数ですので,gradientの計算に行列とベクトルの積が出てきたのだと思います。
計算量に比べてデータの移動が多そうですので,メモリアクセスと書いたのですが,
Tofuが有効だったということでしょうか。
Re:共役勾配法は行列積もなく,単純だから逆に速かったのかな (スコア:1)
最新のじゃないけど、この資料見れば実際にどんなことしてるのか書いてあるよ。
https://www.ssken.gr.jp/MAINSITE/event/2014/20140826-hpcf/lecture-04/S... [ssken.gr.jp]
疎行列ベクトル積は入ってるっぽいね。
チューニングはソフト?ハード? (スコア:1)
コンパイルオプションで最適化忘れてました てへっ
ていう訳じゃあないだろうが、
実用標準アプリで機械同士直接対戦させてみたいものだ。
遺伝的アルゴリズム流して対戦させつつ早く進化した者が勝ちとか
Re:チューニングはソフト?ハード? (スコア:3)
> 実用標準アプリで機械同士直接対戦させてみたいものだ。
門外漢ですが、実用標準アプリの速度を確認するためにも TOP500 の HPL 性能に加えて HPCG 性能も競おう、という話ではないでしょうか。
HPL: 浮動小数点演算能力が支配的
HPCG: メモリアクセス性能が支配的
(現時点の)スパコン用アプリでは浮動小数点演算とメモリアクセスの両方を使うわけですから。
ISC 2015 - HPLを補うベンチマーク「HPCG」(後編) [mynavi.jp]
Re:チューニングはソフト?ハード? (スコア:1)
FlontFlow/Blue Redとか、Adventure Clusterとか、変態レベルの実行効率を誇る実用ソフトもありますよ。
京コンピュータのプロジェクトで集中的に改良された結果ではあるので若干犯則ではあるけど。
Re:チューニングはソフト?ハード? (スコア:1)
当然これはソフトが優秀と言う事。
他のスパコンでも試さなきゃスパコン自体の順位は分からん。
the.ACount
効率 (スコア:1)
京はLINPACKの10PFLOPSに対してHPCGは602TFLOPSで6%、スクフェスでいえばSRの2/3
神威太湖之光はLINPACKの93PFLOPSに対してHPCGは371TFLOPSで0.4%、スクフェスでいえばURの半分以下
疎行列ならこんなもんでしょー
Re:効率 (スコア:1)
スクフェスで例えられてもわからん。ガンダムで例えてくれ。
Re: (スコア:0)
スクフェスで例えられてもわからん。ガンダムで例えてくれ。
例えるなら兵隊さん、もといサラリーマンの位にしておくれ。
Re:効率 (スコア:1)
ぽろっと混ざってるSX-ASE機の効率10%超えが目立つなあ
Re:効率 (スコア:1)
10%越えは全部 SX-ACE, 二つある 5%越えはどちらも SPARC64+Tofu Interconnect, あとは 4% 一つに 0.0~3%台。
Re:効率 (スコア:1)
NEC、次世代スパコン計画Auroraの内容が明らかに
http://www.hpcwire.jp/archives/11584 [hpcwire.jp]
ベクトル型は続けるそうです。
Re: (スコア:0)
なかなかしぶといね、FFT性能もまだまだ劣ってはいないのだろうか?
後継機の開発費を稼ぐことが出来ればニッチ化しつつも開発サイクルを回していけるが、そうでなければスカラー機の付加プロセッサ化/付加システム化するしかないのだろうけど
Re:効率 (スコア:1)
28nmでチップ1個作ろうとするとマスク代だけで1億以上掛かるから
ニッチ化なんて言っているとあっと言う間に行き詰まると思う。
Re: (スコア:0)
別コメントのリンクにある次世代スパコン計画Auroraの資料にはVector Engineの文字が.......
ボードの写真ももろにFPGAで作ったアクセラレータという感じ(放熱器に覆われてデバイスは見えないが)
わざわざ最先端のチップおこすことはしてないでしょ
共役勾配法 (CG法)のみ? (スコア:1)
門外漢ですが、なぜ他のアルゴリズム (BiCGSTABやGMRES) はベンチマークに含まれないのでしょう?
https://eigen.tuxfamily.org/dox-devel/group__TopicSparseSystems.html#B... [tuxfamily.org]
Re: (スコア:0)
端的に言えば、解を求めるのが目的ではないからです
> HPCG is designed to exercise computational and data access patterns that more closely match a different and broad set of important applications, and to give incentive to computer system designers to invest in capabilities that will have impact on the collective performance of these applications.
moreというのはHPL(LINPACK)に対してです
あなたの挙げたアルゴリズムが含まれないのは、たぶん目的に適っていないんでしょう
Re: (スコア:0)
Kryrov部分空間法の中から一つ、代表的なアルゴリズムを選択したからでしょう。
前処理を含めて、あまりにも沢山の手法があり、全部を含めてはいられませんからね。
カーオブザイヤー (スコア:0)
RJCカーオブザイヤーと日本カーオブザイヤーがあって、実力のカーオブザイヤーが取れない場合にお金で買えるカーオブザイヤーをメーカーが取って宣伝に使うようなもん?
ちょっと違うか。
Re: (スコア:0)
ブーメランどうぞ。次は内容を理解してから来てください。
Re: (スコア:0)
別ACだが、ルールは捻じ曲げていないと思うんだよね。
ただ、勝てる勝負でだけ宣伝に使うっていうのが狡い感じがするね。
この勝負だけで1位になれるというのが、実際の利用者にとってどのように有利なのか説明してくれなきゃ。
たとえばどのような処理に適しているのかとか。
のび太の「あやとり」みたいなもので、これなら1位を取れるけど何の役にも立たない特技なのかとか。
Re:Edgeは節電性能とマルウェア検知率が圧倒的です (スコア:1)
自分で俺が世界一の三塁手だって言い出したら謎だけど
世界三塁手ランキングで1位になったって喜ぶのはふつうだろ?
あと「STAP以来の理研の伝統(結果の捏造)」ってお前どうせSTAP以外の結果のねつ造知らんだろ
Re: (スコア:0)
世の中の広告なんて自分の都合にいいことをさらに良く見せるように誇張して書かれているものしかないことを知らないの?
Re: (スコア:0)
二位じゃダメw
ならやるしかありません。
それが使命なのですから。
もっとも、このベンチマークを行なったのは理研でないので、
マッチポンプでも何でもありません。
ある計算では京は世界一だったという事実を素直に喜べば良いだけの話です。