アカウント名:
パスワード:
前々からですが、スパコンのプロセッサは自分で作るものではないという感じですね先端プロセスで専用プロセッサを作る手間とコストを考えたら見合わないし、ウェハー製造を出来るファウンダリも限定されるので.......結局は大量生産のスケールメリットをフルに享受している汎用プロセッサには敵わない
#残念ながら、いくら富士通が頑張ってもSPARCは先のない負け組
スパコンの肝はバンド幅です。また、巨大な超並列となると宇宙線によるソフトエラーが無視できなくなりますが、現在のXEON EはRASの実装が限定的です。ネットワークをシンプルにするにはルータを単純にしてオンチップのI/Oをリッチにする必要があります。また今後のスパコンは「なるべくデータを動かさない」方向で開発が進んでいると聞いています。
XEONやItaniumが要求を満足しているならそれでも構わないのでしょうが、現状の量産チップでは超並列を連続して動かせる信頼性に欠けているので、必要に迫られて自分で作ることになります。ノードごと縮退させるなら現状でもいいのですが、それではいけないと判断してるんでしょう。
ちなみに、富士通のSparc64はOracleでも使っているので、汎用といえば汎用ですね。数はともかくスパコン以外でも開発費用は回収できています。
このままだとSPARC/Oracle/富士通は共倒れになるんじゃないか。。。。。。。。SPARCのロードマップに将来性があるとは思えない
バンド幅がどれぐらい必要かなんてそんなの完全にアプリ次第だし、RASの実装が限定的ってそんなに困ることですか?
16000ノードで5時間かかるLinpackが走り切るぐらいの信頼性があればたいていの科学技術アプリでは問題ないんじゃないですかね。
> RASの実装が限定的ってそんなに困ることですか?
大規模なスパコンだと、割と困りますね。
http://www.geocities.jp/andosprocinfo/wadai13/20130601.htm [geocities.jp]にありますが、> TitanもLinpackはGPUメモリだけで実行できる規模で,1時間くらいで終わっていました。> この理由の一つが,故障発生頻度が高く,マシンが長時間,連続して動かないことであったといわれています。> Tianhe-1AもMTBFが数時間とか言われていました。ハード規模に逆比例して,Tianhe-2でMTBFが更に> 短くなると,なかなかフルシステムでは長時間の計算はできなくなってしまいますし,チェックポイント,> リスタートをするとしてもオーバヘッドが大きくなってしまいます。
てな感じで、せっかく大規模なスパコンを構築しても、信頼性が低いと、大規模な計算には使えないなんてことになってしまうので。
大規模なスパコンのいいところは、大規模な計算にも、あるいは小規模な計算を複数平行して行うのにも使えるところなんですが、前者の利点がなくなり、小規模なスパコンを沢山導入するのと変わらないことになってしまいます。
> てな感じで、せっかく大規模なスパコンを構築しても、信頼性が低いと、大規模な計算には使えないなんて> ことになってしまうので。
一般論としては完全に仰るとおりです。前の書き込みで言いたかったのは「3.3PFで5時間強走ったのなら、1PFあたりのMTBFで比較して倍は違わない可能性はないですかね?」ということでした。
天河2: 3.3PF×5時間強=17時間京: 1PF×30時間弱=30時間
もっと言うと、スパコンのRASって、CPUだけじゃなくてインターコネクトとか冷却システムとか色々考えなきゃいけないし MTBF/PF が10倍とかならさておき、2倍未満ぐらいの差だとXeon E を使ったことで言うほど差が付いていないんじゃないか、という疑問が私の中に湧いているのです。
# 完全に門外漢なので詳しい人に教えて欲しい
> 天河2: 3.3PF×5時間強=17時間> 京: 1PF×30時間弱=30時間
数字間違ってませんか?天河2: 30.65[P Flops]×5[時間]×3600[秒]=550 [Exa Flo]京: 8.162[P Flops]×28[時間]×3600[秒]=820 [Exa Flo]では?
数字は http://www.netlib.org/utk/people/JackDongarra/PAPERS/tianhe-2-dongarra... [netlib.org] http://news.mynavi.jp/articles/2011/07/01/kcomputer/ [mynavi.jp] からとりました。
> MTBFで比較して倍は違わない可能性はないですかね?
解ける問題サイズという観点で見ると、(ピーク性能で5.5倍高いはずの天河2よりも)実は京の方が1.5倍大容量ということになるわけで、やっぱりRAS重要と
どうしてもプロセッサを自作せざるを得ないのならば、プロセッサを単一チップ上で束ねて外付けメモリを付けた方が良いのか、プロセッサ・メモリ一体化チップ(φ300の円形だったら凄い)を配線なり基盤なりで束ねた方が良いのか?素人の馬鹿な思いつきです。
その一方でスパコンでは汎用品のGPUを利用するようになってきている。
それはもう終わった、天河はTeslaだったが、天河二号はXeon Phiになった、Xeon PhiはGPUではないし、Xeonのほどにはサーバには向かない。現状スパコンの性能を上げるには並列度を上げるしかない、この方向に進む限り汎用品は使えなくなる。数だけ揃えるやり方では数が増えるほどエラーが起こりやすくなりマトモに動かなくなる。必要なのは、ソコソコのCPUを可能な限り大量に詰め込んだチップ、これをやったのがXeon Phi、
Xeon Phiだって秋葉原や通販で買える汎用品だよ。エネルギー効率が最悪なSPARCに比べて、Xeon Phiの効率の良さは実に魅力的だね。もうSPARCはオワコンということでFA。
その、アーキテクチャとチップを混同した議論も的外れだと思う。
コアは流用なので専用と言えるかどうかは微妙
まあでも次のエクサスケールスパコンでは、汎用CPUとは別コアになるのはまあ確定でしょうね。性能電力比をやたらと向上させないと消費電力的にヤバいので、ポラックの法則上、シングルスレッド性能を犠牲にせざるをえないはず。
スパコンにバイナリ互換性はいらんだろ。
ハードウェア、ソフトウェアともにメンテナンス要員を維持できないと思いますがその辺どうなんでしょうね。
スパコンで何をするかですよ。TOP500で上位に食い込むことが目的ならそれは十分ありだと思います。スパコンを作ること・技術的挑戦が目的なら専用プロセッサもありですしTOP500に載れなくてもGRAPEシリーズのような目的特化型スパコンもありますから。
> 前々からですが、スパコンのプロセッサは自分で作るものではないという感じですね> #残念ながら、いくら富士通が頑張ってもSPARCは先のない負け組
この天河二号にも、中国が自分で作ったSPARCが使われているようですよ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond
スパコンのプロセッサは自分で作るものではない (スコア:0)
前々からですが、スパコンのプロセッサは自分で作るものではないという感じですね
先端プロセスで専用プロセッサを作る手間とコストを考えたら見合わないし、ウェハー製造を出来るファウンダリも限定されるので.......
結局は大量生産のスケールメリットをフルに享受している汎用プロセッサには敵わない
#残念ながら、いくら富士通が頑張ってもSPARCは先のない負け組
Re:スパコンのプロセッサは自分で作るものではない (スコア:1)
スパコンの肝はバンド幅です。
また、巨大な超並列となると宇宙線によるソフトエラーが無視できなくなりますが、
現在のXEON EはRASの実装が限定的です。
ネットワークをシンプルにするにはルータを単純にしてオンチップのI/Oをリッチにする必要があります。
また今後のスパコンは「なるべくデータを動かさない」方向で開発が進んでいると聞いています。
XEONやItaniumが要求を満足しているならそれでも構わないのでしょうが、現状の量産チップでは
超並列を連続して動かせる信頼性に欠けているので、必要に迫られて自分で作ることになります。
ノードごと縮退させるなら現状でもいいのですが、それではいけないと判断してるんでしょう。
ちなみに、富士通のSparc64はOracleでも使っているので、汎用といえば汎用ですね。数はともかく
スパコン以外でも開発費用は回収できています。
Re: (スコア:0)
このままだとSPARC/Oracle/富士通は共倒れになるんじゃないか。。。。。。。。
SPARCのロードマップに将来性があるとは思えない
Re: (スコア:0)
バンド幅がどれぐらい必要かなんてそんなの完全にアプリ次第だし、
RASの実装が限定的ってそんなに困ることですか?
16000ノードで5時間かかるLinpackが走り切るぐらいの信頼性が
あればたいていの科学技術アプリでは問題ないんじゃないですかね。
Re:スパコンのプロセッサは自分で作るものではない (スコア:4, 興味深い)
> RASの実装が限定的ってそんなに困ることですか?
大規模なスパコンだと、割と困りますね。
http://www.geocities.jp/andosprocinfo/wadai13/20130601.htm [geocities.jp]
にありますが、
> TitanもLinpackはGPUメモリだけで実行できる規模で,1時間くらいで終わっていました。
> この理由の一つが,故障発生頻度が高く,マシンが長時間,連続して動かないことであったといわれています。
> Tianhe-1AもMTBFが数時間とか言われていました。ハード規模に逆比例して,Tianhe-2でMTBFが更に
> 短くなると,なかなかフルシステムでは長時間の計算はできなくなってしまいますし,チェックポイント,
> リスタートをするとしてもオーバヘッドが大きくなってしまいます。
てな感じで、せっかく大規模なスパコンを構築しても、信頼性が低いと、大規模な計算には使えないなんて
ことになってしまうので。
大規模なスパコンのいいところは、大規模な計算にも、あるいは小規模な計算を複数平行して行うのにも
使えるところなんですが、前者の利点がなくなり、小規模なスパコンを沢山導入するのと変わらないことに
なってしまいます。
Re: (スコア:0)
> てな感じで、せっかく大規模なスパコンを構築しても、信頼性が低いと、大規模な計算には使えないなんて
> ことになってしまうので。
一般論としては完全に仰るとおりです。前の書き込みで言いたかったのは
「3.3PFで5時間強走ったのなら、1PFあたりのMTBFで比較して倍は違わない可能性はないですかね?」
ということでした。
天河2: 3.3PF×5時間強=17時間
京: 1PF×30時間弱=30時間
もっと言うと、スパコンのRASって、CPUだけじゃなくてインターコネクトとか冷却システムとか
色々考えなきゃいけないし MTBF/PF が10倍とかならさておき、2倍未満ぐらいの差だと
Xeon E を使ったことで言うほど差が付いていないんじゃないか、という疑問が私の中に
湧いているのです。
# 完全に門外漢なので詳しい人に教えて欲しい
Re: (スコア:0)
> 天河2: 3.3PF×5時間強=17時間
> 京: 1PF×30時間弱=30時間
数字間違ってませんか?
天河2: 30.65[P Flops]×5[時間]×3600[秒]=550 [Exa Flo]
京: 8.162[P Flops]×28[時間]×3600[秒]=820 [Exa Flo]
では?
数字は
http://www.netlib.org/utk/people/JackDongarra/PAPERS/tianhe-2-dongarra... [netlib.org]
http://news.mynavi.jp/articles/2011/07/01/kcomputer/ [mynavi.jp]
からとりました。
> MTBFで比較して倍は違わない可能性はないですかね?
解ける問題サイズという観点で見ると、(ピーク性能で5.5倍高いはずの天河2よりも)
実は京の方が1.5倍大容量ということになるわけで、やっぱりRAS重要と
Re: (スコア:0)
どうしてもプロセッサを自作せざるを得ないのならば、プロセッサを単一チップ上で束ねて外付けメモリを付けた方が良いのか、プロセッサ・メモリ一体化チップ(φ300の円形だったら凄い)を配線なり基盤なりで束ねた方が良いのか?
素人の馬鹿な思いつきです。
Re: (スコア:0)
その一方でスパコンでは汎用品のGPUを利用するようになってきている。
それはもう終わった、天河はTeslaだったが、天河二号はXeon Phiになった、Xeon PhiはGPUではないし、Xeonのほどにはサーバには向かない。
現状スパコンの性能を上げるには並列度を上げるしかない、
この方向に進む限り汎用品は使えなくなる。数だけ揃えるやり方では数が増えるほどエラーが起こりやすくなりマトモに動かなくなる。
必要なのは、ソコソコのCPUを可能な限り大量に詰め込んだチップ、これをやったのがXeon Phi、
Re: (スコア:0)
Xeon Phiだって秋葉原や通販で買える汎用品だよ。
エネルギー効率が最悪なSPARCに比べて、Xeon Phiの効率の良さは実に魅力的だね。
もうSPARCはオワコンということでFA。
Re: (スコア:0)
Re: (スコア:0)
その、アーキテクチャとチップを混同した議論も的外れだと思う。
Re:スパコンのプロセッサは自分で作るものではない (スコア:1)
Sequoiaだって専用CPUでしょ。
Re: (スコア:0)
コアは流用なので専用と言えるかどうかは微妙
Re: (スコア:0)
まあでも次のエクサスケールスパコンでは、汎用CPUとは別コアになるのはまあ確定でしょうね。
性能電力比をやたらと向上させないと消費電力的にヤバいので、ポラックの法則上、
シングルスレッド性能を犠牲にせざるをえないはず。
Re: (スコア:0)
スパコンにバイナリ互換性はいらんだろ。
Re: (スコア:0)
ハードウェア、ソフトウェアともにメンテナンス要員を維持できないと思いますが
その辺どうなんでしょうね。
Re:スパコンのプロセッサは自分で作るものではない (スコア:1)
Re: (スコア:0)
スパコンで何をするかですよ。
TOP500で上位に食い込むことが目的ならそれは十分ありだと思います。
スパコンを作ること・技術的挑戦が目的なら専用プロセッサもありですし
TOP500に載れなくてもGRAPEシリーズのような目的特化型スパコンもありますから。
Re: (スコア:0)
> 前々からですが、スパコンのプロセッサは自分で作るものではないという感じですね
> #残念ながら、いくら富士通が頑張ってもSPARCは先のない負け組
この天河二号にも、中国が自分で作ったSPARCが使われているようですよ