7.52秒でカーネルコンパイル 17
ストーリー by Oliver
トイレすら行けない 部門より
トイレすら行けない 部門より
momokuri 曰く、 "Linuxカーネルのコンパイルで世界最高速をマークしたらしい。カーネルのコンパイルといえば、3昔前は、寝る前にmake zImage >make.log & などとした(しかも目が覚めるとエラーになってたり(*_*;;)ものだが、肥大化した現在のカーネルで、7.52秒ってどうよ。
そのうち、なにかの法則どおり、数年で、Debian GNU/LinuxパッケージのFull Make数秒なんて時代がくるのかしらん。"
こういうマシンをTSSで... (スコア:2, おもしろおかしい)
カーネルコンパイルするのに安価で10秒だけ借りるとか出来れば、すっごく楽なんだけど。(w
ちなみに、英語が得意ではないので教えてください。
POWER4 1.1GHz 8CPU メモリ60GBのマシンでクロスコンパイルしたと読んだのですが、32 way logical partitionとはどういう意味でしょう?
tink (tink@mail.le.to)
Re:こういうマシンをTSSで... (スコア:1)
[lwn.net]で、今回は8CPUを追加した、ということです。
Re:こういうマシンをTSSで... (スコア:1)
と、ちゃんと書いてありますね。
何処読んでるんだろう、恥ずかしいなぁ。:-p
tink (tink@mail.le.to)
Re:こういうマシンをTSSで... (スコア:0)
できたと思います。それとLPARという謎の手法を
用いることで、8チップで32Wayになるらしいです。
詳しくはIBMのページ [ibm.com]
Re:こういうマシンをTSSで... (スコア:1)
POWER4チップを8個乗せたMCMというのがあるんですね。
そのモジュールを4個積めるので、32Way構成だと。
更に、システム全体で16個までのOSに自由に各プロセッサチップを割り当て出来るようですね。
1つのPOWER4プロセッサチップに2のコアが載っているという記述もありますので、プロセッサコア数としては64個という事なんだろうか...
32Wayということは、すべてのプロセッサをカーネルコンパイルに割り当てたという事かな。
それで、2246% CPUということは、プロセッサ能力以外のボトルネックによって、能力を使いきれなかったという事でしょうか?
別世界の話のように感じますが、パワーのあるコンピュータというのには純粋に憧れます。
tink (tink@mail.le.to)
Re:こういうマシンをTSSで... (スコア:1)
MCMとは、一つのダイに8つのプロセッサを実装したモジュールのことです。
で、MCMが4つ搭載されているので、32Wayです。
(P4 XeonのHyperThreadingみたいな物?)
http://www-6.ibm.com/jp/servers/intro_tec.html
LPAR(LogicalPartitioning)っていうのは、コンピューターの筐体を論理的に
複数のコンピューターに分割して使うという技術です。
簡単に説明すると、CPU 10メモリ15GB個のうちCPU5個とメモリ10GBでAIXを動かして
残りCPU1個とメモリ1GBずつで5個のLinuxを動かすなんてことができるわけです。
記事の7.52secっていう数値は、どういうLPARの構成で動かしたのかはわかりませんが・・・
Re:こういうマシンをTSSで... (スコア:1)
そんな機能は無いです。
> 記事の7.52secっていう数値は、どういうLPARの構成で動かしたのかはわかりませんが・・・
推測ですが、くだんのマシンは最大構成で32CPUですから、LPARといいつつも 全部(32CPU)使ったのでしょう。じゃあ、なんでわざわざLPARと言ったのかと いうと、何日か前にLPARで24CPU で測定しているので、その名残でしょう。
いくら並列性のよいアプリとは言え、 24CPUで10.3秒で32CPUで7.52秒というのは、この規模ではよいスケーラ ビリティです。 "rewrote the ppc64 pagetable management code to do lockless inserts and removals" という工夫の賜物なんでしょうね。変更前はどれぐらいだったかが興味ありますが。:-)
Re:こういうマシンをTSSで... (スコア:1)
>MCMとは、一つのダイに8つのプロセッサを実装したモジュールのことです。
説明 [ascii24.com]をよく読んでみましょう。
Power4では、1chip(ダイ)にSMP構成で2cpu搭載を実現しているそうです。
そして、それをパッケージ側で4個実装したものが一つのモジュールユニットに
なってます。
MCMはMulti-chip Moduleの略字なので、文字どおりシリコンのchipは
MCM module中に複数あるわけです。
決して、1chipのダイに8cpuを乗っけているわけではないので、
誤解なきように。
#実際にchipを実装する側にとっちゃえらい違いです。
#たぶん、chip製造の際にchipサイズを小さくして良品率をあげる
#ためと、配線寿命を延ばすための工夫なんでしょうねぇ・・・。
---- redbrick
いま、カーネルのコンパイル中だから (スコア:2, 興味深い)
「ちょっとね、他に仕事があるのが遅れそうなんですよ」とか言いつつ/.Jを読む(書く)楽しみがなくなりそうで。。。。
オンメモリ? (スコア:1)
> 128.89user 40.23system 0:07.52elapsed 2246%CPU (0avgtext+0avgdata 0maxresident)k
> 0inputs+0outputs (437084major+572835minor)pagefaults 0swaps
とあるので、ファイルが全部メモリ上に乗っている状態で測ったものに思えます。
だとしたら、最初の印象ほど速くは感じられませんが、合ってるでしょうか?
Re:オンメモリ? (スコア:1)
だって60GBのメモリ載っけてるみたいだから。
CPUのベンチマークしたようなもんかね?
Re:オンメモリ? (スコア:1)
展開できるな.
(ソースだけでなくオブジェクトの格納やgccもオンメモリ)
ひょとしてスワップファイルシステムもオンメモリ? (^^)
Re:オンメモリ? (スコア:1)
IA32のオンメモリなら、どれくらいかかるのだらふ?
L3 Cache は 128MB? (スコア:1)
このマシンは IBM eServer pSeries 690 だと思われます。
このシリーズにはオフチップとはいえプロセッサ(2PE毎)あたり
128MB の L3 キャッシュを持っているマシンがいます。
ベンチマークを動かしたマシンの L3 キャッシュの容量は不明ですが、
メインメモリが 60GB だと相応量の L3 キャッシュがあるはずです。
下手をするとすべてのソースコードがキャッシュに載っていたかも?
コンタミは発見の母
パッケージャとして使いたい (スコア:1)
このマシンをカーネル配布マシンとして使いたいです。自分の希望するconfigをアップロードして実行させるとコンパイルして、適当なパッケージ(例えばdebとかね、これも指定可能)を送り返してくれる仕組みを作ってもらいたいなぁ。
たぶん自前でコンパイルするよりもよっぽどその方が早いと思う。
職業としてのプログラマ
Re:パッケージャとして使いたい (スコア:0)
Re:パッケージャとして使いたい (スコア:1)
職業としてのプログラマ