アカウント名:
パスワード:
今はコストなど度外視して作った特別なスーパーコンピューターの時代じゃない普通のパソコンのプロセッサ(または普通のパソコン程度のプロセッサ)をパラに並べてコスト・パフォーマンスを競うだけの、ハイ・パフォーマンス・コンピューティング(HPC)の時代コスト・パフォーマンスを求める現実的アプリケーションの無い国ではHPCなど必要とされない
普通のパソコンのプロセッサを並列にする、というやり方はそろそろ破綻をきたしそうです。なぜなら、数万個のCPUを故障無く一定時間動かせるほどには、CPU自体の信頼性が高くないからです。そろそろCPUについてもスパコン用のCPUが必要になる時代がまた来るかもしれません。スパコンが求めるCPUの仕様は昔は性能命だったけど、現在は信頼性と消費電力(とそれなりの性能)のバランスが大事になってきています。
応用数理・情報の先生とかが、アルゴリズムや予兆対応・被害極小化の研究をしているので、その成果がそのうち出てくると思う。
だからこその「京」なんじゃあるまいかと。そのスパコン用のCPUを設計したのがあれのウリなんですよ。
あれぐらいの規模になるとCPU自体が完全無欠に製造されていたとしても宇宙線とかが外から飛んできてガンガンビット化けして、毎日何十回~何百回ぐらいのオーダーで回路中の値がバグるから、ECCによるエラー訂正、パリティチェック+二重化、三重化+多数決とか、いろんな方法で演算回路やバス、キャッシュメモリ、TLBその他を保護してやっと8万ノードをまる一日動かせたわけで。
Intelの普通のCPUもハイエンドな(*-EX)方にはそれなりに信頼性のための回路もいろいろ積まれているけれども、「京」のSPARCはもともと8万ノードを想定して設計しているのでレベルが違う。もちろんその分回路面積が増大してローエンド向けにはコスト面で不利になっているのは否めないですが。
東電様のおかげで、しばらくの間、関東/東北にスパコンなんか設置できないんじゃないかな?電力事情もしかり、放射線事情もしかり。
全てのノードが故障なく動くこと前提とか京ってのはどんだけタコな設計なんだよw
ちゃんと故障しても大丈夫な設計になっていますよ。ネットワークもしかり。
京はスパコンのために一応専用CUPを作って信頼性を担保しました。ところが,わざわざ汎用CUPの方がコスパが高いので(当然),もう汎用CUPでよくね?っという意見もありますが,特にこれからはそうじゃなくなってくるでしょう。(サーバ用CPUでも信頼性が足りない)CPUを作れないとスパコンを作れない時代がまた来るかもしれません。ただ,CUP超並列化でCPUに高信頼性を求める方法もいずれ限界が来るかも。
京で興味深かったのが,CPUは水冷ですが,その理由が「信頼性の保証」だったこと。CPUの動作温度を下げると当然故障は減るわけですが,水冷はちゃんと作らないと簡単に故障の原因になるので意外でした。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond
スパコンの時代じゃない (スコア:0)
今はコストなど度外視して作った特別なスーパーコンピューターの時代じゃない
普通のパソコンのプロセッサ(または普通のパソコン程度のプロセッサ)をパラに並べてコスト・パフォーマンスを競うだけの、ハイ・パフォーマンス・コンピューティング(HPC)の時代
コスト・パフォーマンスを求める現実的アプリケーションの無い国ではHPCなど必要とされない
Re:スパコンの時代じゃない (スコア:1)
普通のパソコンのプロセッサを並列にする、というやり方はそろそろ破綻をきたしそうです。
なぜなら、数万個のCPUを故障無く一定時間動かせるほどには、CPU自体の信頼性が高くないからです。
そろそろCPUについてもスパコン用のCPUが必要になる時代がまた来るかもしれません。
スパコンが求めるCPUの仕様は昔は性能命だったけど、現在は信頼性と消費電力(とそれなりの性能)のバランスが大事になってきています。
Re: (スコア:0)
応用数理・情報の先生とかが、アルゴリズムや予兆対応・被害極小化の研究をしているので、その成果がそのうち出てくると思う。
Re: (スコア:0)
だからこその「京」なんじゃあるまいかと。
そのスパコン用のCPUを設計したのがあれのウリなんですよ。
あれぐらいの規模になるとCPU自体が完全無欠に製造されて
いたとしても宇宙線とかが外から飛んできてガンガンビット化け
して、毎日何十回~何百回ぐらいのオーダーで回路中の値が
バグるから、ECCによるエラー訂正、パリティチェック+二重化、
三重化+多数決とか、いろんな方法で演算回路やバス、
キャッシュメモリ、TLBその他を保護してやっと8万ノードを
まる一日動かせたわけで。
Intelの普通のCPUもハイエンドな(*-EX)方にはそれなりに
信頼性のための回路もいろいろ積まれているけれども、
「京」のSPARCはもともと8万ノードを想定して設計しているので
レベルが違う。もちろんその分回路面積が増大してローエンド
向けにはコスト面で不利になっているのは否めないですが。
Re: (スコア:0)
東電様のおかげで、しばらくの間、関東/東北にスパコンなんか設置できないんじゃないかな?
電力事情もしかり、放射線事情もしかり。
Re: (スコア:0)
全てのノードが故障なく動くこと前提とか京ってのはどんだけタコな設計なんだよw
Re: (スコア:0)
ちゃんと故障しても大丈夫な設計になっていますよ。
ネットワークもしかり。
京はスパコンのために一応専用CUPを作って信頼性を担保しました。
ところが,わざわざ汎用CUPの方がコスパが高いので(当然),もう汎用CUPでよくね?っという
意見もありますが,特にこれからはそうじゃなくなってくるでしょう。
(サーバ用CPUでも信頼性が足りない)
CPUを作れないとスパコンを作れない時代がまた来るかもしれません。
ただ,CUP超並列化でCPUに高信頼性を求める方法もいずれ限界が来るかも。
京で興味深かったのが,CPUは水冷ですが,その理由が「信頼性の保証」だったこと。
CPUの動作温度を下げると当然故障は減るわけですが,
水冷はちゃんと作らないと簡単に故障の原因になるので意外でした。