アカウント名:
パスワード:
さんざん既出だけど、京の使い道って何?
「事業仕分け (行政刷新会議)」で、「次世代スーパーコンピュータ」(当時は「京」と名付けられる前だった)は「予算計上見送りに近い縮減」(事実上の凍結)と判定された後、巻き返しが図られ、こうなった訳だけど。Wikipediaによると、「プロジェクトの目的は、過去に世界最高性能を記録した数値風洞、CP-PACS、地球シミュレータに続くナショナル・リーダーシップ・スーパーコンピュータの構築、およびプロジェクトを通じた計算科学・計算機科学分野の人材育成」だそうだが。ベクトル・スカラ複合型からベクトル部を切り捨て、スカラ型になった時点で、11.2億円のスカラ型量産スパコン50台を導入した方が、総事業費約1120億円かけた「京」より、よほど物の役に立つと、誰しも思うことだ。見栄(ナショナル・リーダーシップ・スーパーコンピュータの構築)を捨てて、プロジェクトを通じて計算科学・計算機科学分野の人材育成したところで、どうせ日銀主導の円高による産業空洞化で、中国に流れていくだけだし。
プロセッサ時間、ジョブ優先度でオークションして一般開放でもすればいくらでも使えるだろうよ。
だったら安くてそこそこの性能のスパコンたくさん作ったほうがいいんでないの?というのが上のACの言いたいことなんじゃないかな
安くてそこそこの性能のスパコンをたくさん作ったら、高性能なスパコンの代わりになると思っている時点でだいぶアレちりが積って山になる事もあれば、単なるゴミの山にしかならんこともある
安くてそこそこの性能のスパコンをたくさん作ったら、高性能なスパコンの代わりになるか?
かなりの比率でYes.なぜならスパコンのほとんどの処理時間は分割されて使われていますので.大規模な割り当てもらうの大変ですし(枠も少ない).
例えば地球シミュレータ2,160ノードありますけど,2011年の利用実績をご覧いただくとわかるとおり
http://www.jamstec.go.jp/es/jp/status/2011req.html [jamstec.go.jp]
3割強以上のノード(65ノード以上)を利用したのはジョブ数(下のグラフ)にして1.8%に過ぎません.実際のCPU時間(上のグラフ)で見てもほとんど無いのはご覧の通り.CPU時間で見てほとんどのジョブは1/5以下(32ノード以下)のノードで走ってます.つまり,1/5のスパコンが5台だったとしてもあまり変わらないレベル.
規模が半分で良ければ価格は半分以下になりますので,例えば「最高性能のスパコン1台か,その1/2の性能のスパコンが3台か,どっちが良い?」と聞かれたら.大部分の研究者にとっては後者の方が遙かに便利と言うことになります.
じゃあなんでみんなでそっちを要求しないのかというと,ぶっちゃけて言うと,ほら,それだと予算が付きにくいので……ある性能の1台,とかなら通るかもしれませんが,それを3台とか言うとまず無理でしょう.だったらいっそのこと同じ値段で1台あたりの演算能力はもっと高い(けどトータルの性能はたいていの場合で低い)ものを要求した方が予算が付きやすいというか……
これだけでかいスパコンの計算能力上の意義に疑問を投げかけといてあれですが,でかいスパコンの開発自体の意義は認めています.そういうでかいものを開発する人がどこかにいるおかげで,もっと小さい規模のものが安く入手できるようになるわけで.
そんなわけで,「スパコンとしての計算能力を追求する手段」としての世界トップクラスのスパコン開発には疑問がありますが,「スパコンそのものを発展させるためのスパコン開発」自体はある程度やるべきだと思います.#でもその理由付けが,「世界最大規模の計算をやるため」ってのは#どうもとってつけたような気がして気に入らないというか.#いえ,そう言わないと予算が付きにくいのはわかるんですが.
>バカでかい計算一発に意味がある問題向けに作ったってことなんでしょう。
それも無いではないんですが,理研の方の話を聞く限りではもっと単純に「生命科学用のスパコンが欲しい!出来ればでかい方がいい!」とかそんな雰囲気も.……いえ,うちの組織も絡んでるんで,否定的なことばかり言うと上司に怒られるのですが.
当初の夢(例えば茅先生達の夢)としては,階層をまたいだ計算(*)を実現して,より統一的な理解を実現する(そして精密科学のレベルまで持って行く)というのをぶち上げていたんですが,いろいろ検討が重ねられた結果結局それは現状の計算能力ではフルに利用したとしてもとても足りない(桁でいくつか足りない),という.(新しい計算法の開発も進んでいて進展はあるんですが,当初の「夢」がでかすぎて追いついていない)
*例えば単純な1分子は,量子化学計算により非常に精密に計算できます.しかしタンパクぐらいになるとそういう精密な計算では計算量が発散してとても計算できず,もっと経験的手法が使われます.さらに周辺の溶媒の効果を取り込んだり,分子集合体である生体膜などになると経験的手法ですら計算が発散してしまうため,もっと単純な剛体球+引力(斥力)といった単純な扱いや,統計的な扱いになります.このように生体を扱おうとすると異なる階層で異なる手段が用いられるわけですが,これを計算力を駆使して同じ計算手法で原子から生体組織まで取り扱いたいとか,細胞の中での酵素反応を細胞丸ごと計算に取り込みつつピンポイントな部分は量子化学計算並みの精度で計算したいとか,そういうのがそもそもの夢です.
スパコンセンターを作ったり,そういった組織を中心にして生体分子系の計算手法(理論&アルゴリズム)の開発をしたり,とかは非常に素晴らしいと思うんですが(そういうことは今もどんどん進んでいます),使うスパコンが本当に世界一の必要があるの?とかいうと,ほら,そこはまあ.(生命科学系を中心とした計算系の組織を作り上げるために,予算獲得の旗印としてぶち上げた,という印象が……)#とか言うとボスに怒られます.
「生命科学系」のひとくくりにするのはどうかと思うのでちょっと補足。
量子科学計算やってる人には計算能力が桁でいくつか足りないので計算力でスケールさせるよりよりよいモデルを作る方が生物学のアウトプットとしてはずっと重要ですが、その他の、例えばゲノム解析とかやってる人には京ぐらいの計算量でも十分魅力的ですので「使うスパコンが本当に世界一の必要があるの?」という話が出るのは単にアプリ選定が間違ってるだけのような気がしなくもないです。生命系のグラチャレ課題リストとか見るとどれも計算力よりモデルが効いてくる問題ばかりに見える。中の人がどう思っているのか聞きたい。
スパコンの専門じゃないんでそんなに詳しくはないんですが,
・でかくなればなるほどインターコネクトなど接続部の設計がどんどん大変になる.・10の規模のスパコンで効率(例えば)90%を実現するより,20の規模のスパコンで効率90%を実現する方が大変(大規模化するほど効率が落ちる,つまり倍の演算力を実現するには倍以上の規模にするか,効率の向上をもっと頑張る必要がある).・ある程度以下のサイズのスパコンだと,すでに開発済みでパッケージ化され多数販売されているので安い.
とかそんな話は聞いたことが.
素人意見ですが,単純に100の規模のものをつくるノウハウが確立しているときに50の規模のものをつくるのは容易く,500の規模のものをつくるのは難しいしということではないかと.新しいことにチャレンジしなければその時点でのコストパフォーマンスはいいでしょうが,未来もないように思います.
はい、核兵器を考慮しない場合で、1120億円或いは2000億円ぐらい使って、地上駆逐艦(こんごう級水上駆逐艦で約1223億円)作るより、T-34を沢山作った方が強いと言うことです。
水上戦闘艦大和の建造費が1億4千万円。T34の製造費が、269,500ルーブルから、193,000ルーブルへ下がり、その後更に135,000ルーブルとなっているから、為替換算にもよるが、ざっと20万円強から10万円強。地上戦闘艦大和一隻2億円対T-34×1500台。クルスクの戦いに投入されたソ連側の戦車3600両の半分弱か。意外にT34って、高いんだ。
ガンダム一機作るよりも地上ならフライマンタとデプロッグ、宇宙ではトリアーエズとボールを作りまくって数の暴力に物を言わせた方が、ということですね。(ギレンの野望ではほんとにそうであることも良くあるので困る)
予算の問題は確かにあるでしょうね。宇宙開発でも機会が少ないので何でも観測機を詰め込んで無茶な軽量化をするのと同じで,日本の技術開発の欠点(利点でもあるかも)ですね。
まあ,でも世界最速(最先端でもいいけど)のコンピュータを一部分でも使えるとなるとプログラマのモチベーションも上がるでしょう。それにいい結果が出来れば全コアを使って割と簡単にスケールアップできるというのも魅力なのでは。
どのみちいきなり全ノードを使うのではなく,最初は一部のノードでバグだしやアルゴリズムの最適化をするでしょうし。同時に全ノードを使う計算が少なくても意味はあるでしょう。(ちょっと少ない気もするけど)
実行効率 93.2 %はすごいですね。おめでとう。
たとえ2%未満でも、地球シミュレータでしかできない計算をやったんなら、それでいいんじゃないの?大きなスパコンを小さく使うことはできるけど、小さなスパコンをつなげても大きな計算は解けないよ。
スパコンの開発能力を維持するためだとか,スパコンの進歩自体を目標とした開発自体は否定しませんよ.それは必要なことですし.
単に,研究者側として単純に計算能力が欲しいというだけなら,もうちょっと小規模なやつを数揃えた方がパフォーマンスは高い,って言いたいだけで.
計算機としてのパフォーマンスは高いけれど、計算機を使う事が目的ではありません。科学の研究結果としては、どこでもできる結果が大量に出るだけで、科学的価値はとても低いです。
この分野に限らず、未知の現象の計算に、計算機の計算能力が桁違いに必要なテーマはそこそこあり、それらを現実的な時間で計算するには、・ 誰かが、とんでもなく計算効率の上がるアルゴリズム・精度の良い近似を思いつく・ とんでもない速度の計算機を作る必要があります。前者はコストを掛ければ必ず出てくるとも限りませんし、後者はある意味コストを掛けるだけ結果が出ます。どちらか一方では価値が薄く、どちらもそれなりにコストを掛けなければなりません。
もちろん、その研究テーマにそれだけの価値がないなら、作らない方が良いという意見はあるでしょう。ですが、「小規模な物を沢山」というのは、上の2つの発展のどちらをも伸ばすことができません。前者の研究はパソコンレベルの計算能力で研究できますし、後者には使えない、無用の長物に中途半端なコストを掛けることになります。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
吾輩はリファレンスである。名前はまだ無い -- perlの中の人
さんざん既出だけど、「京」の使い道って何? (スコア:1)
さんざん既出だけど、京の使い道って何?
「事業仕分け (行政刷新会議)」で、「次世代スーパーコンピュータ」(当時は「京」と名付けられる前だった)は「予算計上見送りに近い縮減」(事実上の凍結)と判定された後、巻き返しが図られ、こうなった訳だけど。
Wikipediaによると、「プロジェクトの目的は、過去に世界最高性能を記録した数値風洞、CP-PACS、地球シミュレータに続くナショナル・リーダーシップ・スーパーコンピュータの構築、およびプロジェクトを通じた計算科学・計算機科学分野の人材育成」だそうだが。
ベクトル・スカラ複合型からベクトル部を切り捨て、スカラ型になった時点で、11.2億円のスカラ型量産スパコン50台を導入した方が、総事業費約1120億円かけた「京」より、よほど物の役に立つと、誰しも思うことだ。
見栄(ナショナル・リーダーシップ・スーパーコンピュータの構築)を捨てて、プロジェクトを通じて計算科学・計算機科学分野の人材育成したところで、どうせ日銀主導の円高による産業空洞化で、中国に流れていくだけだし。
Re: (スコア:1)
プロセッサ時間、ジョブ優先度でオークションして一般開放でもすればいくらでも使えるだろうよ。
Re:さんざん既出だけど、「京」の使い道って何? (スコア:1)
だったら安くてそこそこの性能のスパコンたくさん作ったほうがいいんでないの?というのが上のACの言いたいことなんじゃないかな
Re: (スコア:0)
安くてそこそこの性能のスパコンをたくさん作ったら、高性能なスパコンの代わりになると思っている時点でだいぶアレ
ちりが積って山になる事もあれば、単なるゴミの山にしかならんこともある
Re:さんざん既出だけど、「京」の使い道って何? (スコア:3, すばらしい洞察)
安くてそこそこの性能のスパコンをたくさん作ったら、高性能なスパコンの代わりになるか?
かなりの比率でYes.
なぜならスパコンのほとんどの処理時間は分割されて使われていますので.
大規模な割り当てもらうの大変ですし(枠も少ない).
例えば地球シミュレータ2,160ノードありますけど,2011年の利用実績をご覧いただくとわかるとおり
http://www.jamstec.go.jp/es/jp/status/2011req.html [jamstec.go.jp]
3割強以上のノード(65ノード以上)を利用したのはジョブ数(下のグラフ)にして1.8%に過ぎません.実際のCPU時間(上のグラフ)で見てもほとんど無いのはご覧の通り.CPU時間で見てほとんどのジョブは1/5以下(32ノード以下)のノードで走ってます.つまり,1/5のスパコンが5台だったとしてもあまり変わらないレベル.
規模が半分で良ければ価格は半分以下になりますので,例えば「最高性能のスパコン1台か,その1/2の性能のスパコンが3台か,どっちが良い?」と聞かれたら.大部分の研究者にとっては後者の方が遙かに便利と言うことになります.
じゃあなんでみんなでそっちを要求しないのかというと,ぶっちゃけて言うと,ほら,それだと予算が付きにくいので……
ある性能の1台,とかなら通るかもしれませんが,それを3台とか言うとまず無理でしょう.だったらいっそのこと同じ値段で1台あたりの演算能力はもっと高い(けどトータルの性能はたいていの場合で低い)ものを要求した方が予算が付きやすいというか……
補足 (スコア:2)
これだけでかいスパコンの計算能力上の意義に疑問を投げかけといてあれですが,でかいスパコンの開発自体の意義は認めています.
そういうでかいものを開発する人がどこかにいるおかげで,もっと小さい規模のものが安く入手できるようになるわけで.
そんなわけで,「スパコンとしての計算能力を追求する手段」としての世界トップクラスのスパコン開発には疑問がありますが,「スパコンそのものを発展させるためのスパコン開発」自体はある程度やるべきだと思います.
#でもその理由付けが,「世界最大規模の計算をやるため」ってのは
#どうもとってつけたような気がして気に入らないというか.
#いえ,そう言わないと予算が付きにくいのはわかるんですが.
Re:さんざん既出だけど、「京」の使い道って何? (スコア:1)
Re:さんざん既出だけど、「京」の使い道って何? (スコア:5, 興味深い)
>バカでかい計算一発に意味がある問題向けに作ったってことなんでしょう。
それも無いではないんですが,理研の方の話を聞く限りではもっと単純に「生命科学用のスパコンが欲しい!出来ればでかい方がいい!」とかそんな雰囲気も.
……いえ,うちの組織も絡んでるんで,否定的なことばかり言うと上司に怒られるのですが.
当初の夢(例えば茅先生達の夢)としては,階層をまたいだ計算(*)を実現して,より統一的な理解を実現する(そして精密科学のレベルまで持って行く)というのをぶち上げていたんですが,いろいろ検討が重ねられた結果結局それは現状の計算能力ではフルに利用したとしてもとても足りない(桁でいくつか足りない),という.
(新しい計算法の開発も進んでいて進展はあるんですが,当初の「夢」がでかすぎて追いついていない)
*例えば単純な1分子は,量子化学計算により非常に精密に計算できます.しかしタンパクぐらいになるとそういう精密な計算では計算量が発散してとても計算できず,もっと経験的手法が使われます.さらに周辺の溶媒の効果を取り込んだり,分子集合体である生体膜などになると経験的手法ですら計算が発散してしまうため,もっと単純な剛体球+引力(斥力)といった単純な扱いや,統計的な扱いになります.このように生体を扱おうとすると異なる階層で異なる手段が用いられるわけですが,これを計算力を駆使して同じ計算手法で原子から生体組織まで取り扱いたいとか,細胞の中での酵素反応を細胞丸ごと計算に取り込みつつピンポイントな部分は量子化学計算並みの精度で計算したいとか,そういうのがそもそもの夢です.
スパコンセンターを作ったり,そういった組織を中心にして生体分子系の計算手法(理論&アルゴリズム)の開発をしたり,とかは非常に素晴らしいと思うんですが(そういうことは今もどんどん進んでいます),使うスパコンが本当に世界一の必要があるの?とかいうと,ほら,そこはまあ.
(生命科学系を中心とした計算系の組織を作り上げるために,予算獲得の旗印としてぶち上げた,という印象が……)
#とか言うとボスに怒られます.
Re:さんざん既出だけど、「京」の使い道って何? (スコア:1)
「生命科学系」のひとくくりにするのはどうかと思うのでちょっと補足。
量子科学計算やってる人には計算能力が桁でいくつか足りないので
計算力でスケールさせるよりよりよいモデルを作る方が生物学の
アウトプットとしてはずっと重要ですが、その他の、例えばゲノム解析とか
やってる人には京ぐらいの計算量でも十分魅力的ですので
「使うスパコンが本当に世界一の必要があるの?」という話が出るのは
単にアプリ選定が間違ってるだけのような気がしなくもないです。
生命系のグラチャレ課題リストとか見るとどれも計算力よりモデルが
効いてくる問題ばかりに見える。中の人がどう思っているのか聞きたい。
Re:さんざん既出だけど、「京」の使い道って何? (スコア:1)
Re:さんざん既出だけど、「京」の使い道って何? (スコア:2)
スパコンの専門じゃないんでそんなに詳しくはないんですが,
・でかくなればなるほどインターコネクトなど接続部の設計がどんどん大変になる.
・10の規模のスパコンで効率(例えば)90%を実現するより,20の規模のスパコンで効率90%を実現する方が大変(大規模化するほど効率が落ちる,つまり倍の演算力を実現するには倍以上の規模にするか,効率の向上をもっと頑張る必要がある).
・ある程度以下のサイズのスパコンだと,すでに開発済みでパッケージ化され多数販売されているので安い.
とかそんな話は聞いたことが.
Re: (スコア:0)
素人意見ですが,単純に100の規模のものをつくるノウハウが確立しているときに50の規模のものをつくるのは容易く,500の規模のものをつくるのは難しいしということではないかと.
新しいことにチャレンジしなければその時点でのコストパフォーマンスはいいでしょうが,未来もないように思います.
兄貴、戦争は数だぜ (スコア:0)
はい、核兵器を考慮しない場合で、1120億円或いは2000億円ぐらい使って、地上駆逐艦(こんごう級水上駆逐艦で約1223億円)作るより、T-34を沢山作った方が強いと言うことです。
Re: (スコア:0)
喫水より下に撃てないから寄っちまえばこっちのモンてのは置いといいて、お互いに有利な距離で撃ち合うなら
Re: (スコア:0)
水上戦闘艦大和の建造費が1億4千万円。
T34の製造費が、269,500ルーブルから、193,000ルーブルへ下がり、その後更に135,000ルーブルとなっているから、
為替換算にもよるが、ざっと20万円強から10万円強。
地上戦闘艦大和一隻2億円対T-34×1500台。
クルスクの戦いに投入されたソ連側の戦車3600両の半分弱か。
意外にT34って、高いんだ。
Re: (スコア:0)
ガンダム一機作るよりも地上ならフライマンタとデプロッグ、宇宙ではトリアーエズとボールを作りまくって数の暴力に物を言わせた方が、ということですね。
(ギレンの野望ではほんとにそうであることも良くあるので困る)
Re:さんざん既出だけど、「京」の使い道って何? (スコア:1)
地球シミュレータみたいに1段クロスバ接続(256ノードあれば1対255の接続をすべてのノードで行う)だとノード数の2乗に比例して接続数が増えるんですが、京は6次元メッシュ/トーラスなのでノードと接続は比例します。
ノードが半分で接続数も半分ならコスト的には半分にしかならないはずです。なので、京の1/2の性能のスパコンを2つ作っても建屋の費用などの要因で京以上の費用になるはずです。
メッシュ/トーラス接続ではデータや演算の割り当てが難しくなるのでソフトウェアの開発費が膨らむ可能性がありますがそれは別の話ですよね。
開発済みのパッケージを買えば安いのは確かなんですが、だからといって開発する必要が無い訳ではないですし。
なので、状況にもよるんですが小さい物を複数作るより、でかい計算機作って必要な時に必要分だけ貸し出すのが一番効率じゃないでしょうか?
京はメッシュ/トーラスネットワークにより、どのノード群を切り出してもトーラスネットワークを構築できて(普通はメッシュになる)計算機の分割がやりやすいのが売りなので、計算機は借りやすいと思いますよ。値段は知りませんが。
Re: (スコア:0)
アニメに準ずるなら、1話でガンダムがザクマシンガンに対して無敵だとはっきり描かれているわけで、ザク以下の兵器をいくら並べてもガンダム1機で無双されてしまう。
史実でも朝鮮戦争初期の韓国軍のように、対戦車戦闘装備の不十分な歩兵をいくら揃えても少数の戦車に蹂躙されてしまうという例はいくらでもある。
Re: (スコア:0)
予算の問題は確かにあるでしょうね。
宇宙開発でも機会が少ないので何でも観測機を詰め込んで無茶な軽量化をするのと同じで,
日本の技術開発の欠点(利点でもあるかも)ですね。
まあ,でも世界最速(最先端でもいいけど)のコンピュータを一部分でも使えるとなると
プログラマのモチベーションも上がるでしょう。
それにいい結果が出来れば全コアを使って割と簡単にスケールアップできるというのも魅力なのでは。
どのみちいきなり全ノードを使うのではなく,最初は一部のノードでバグだしやアルゴリズムの最適化をするでしょうし。
同時に全ノードを使う計算が少なくても意味はあるでしょう。(ちょっと少ない気もするけど)
実行効率 93.2 %はすごいですね。おめでとう。
Re: (スコア:0)
たとえ2%未満でも、地球シミュレータでしかできない計算をやったんなら、それでいいんじゃないの?
大きなスパコンを小さく使うことはできるけど、小さなスパコンをつなげても大きな計算は解けないよ。
Re:さんざん既出だけど、「京」の使い道って何? (スコア:1)
スパコンの開発能力を維持するためだとか,スパコンの進歩自体を目標とした開発自体は否定しませんよ.それは必要なことですし.
単に,研究者側として単純に計算能力が欲しいというだけなら,もうちょっと小規模なやつを数揃えた方がパフォーマンスは高い,って言いたいだけで.
Re: (スコア:0)
計算機としてのパフォーマンスは高いけれど、計算機を使う事が目的ではありません。科学の研究結果としては、どこでもできる結果が大量に出るだけで、科学的価値はとても低いです。
この分野に限らず、未知の現象の計算に、計算機の計算能力が桁違いに必要なテーマはそこそこあり、それらを現実的な時間で計算するには、
・ 誰かが、とんでもなく計算効率の上がるアルゴリズム・精度の良い近似を思いつく
・ とんでもない速度の計算機を作る
必要があります。
前者はコストを掛ければ必ず出てくるとも限りませんし、後者はある意味コストを掛けるだけ結果が出ます。
どちらか一方では価値が薄く、どちらもそれなりにコストを掛けなければなりません。
もちろん、その研究テーマにそれだけの価値がないなら、作らない方が良いという意見はあるでしょう。
ですが、「小規模な物を沢山」というのは、上の2つの発展のどちらをも伸ばすことができません。前者の研究はパソコンレベルの計算能力で研究できますし、後者には使えない、無用の長物に中途半端なコストを掛けることになります。