floatの日記: Craig Silverstein answers your Google questions
2) Network Management Tools/Technologies
by kaladorn
ネットワーク管理ツール/技術 by kaladorn
What technologies help to support the Google server farm?
Googleのサーバ群をサポートしてるのはどんな技術ですか?
What kind of automated monitoring and trouble reporting tools are in use?
自動監視や障害報告にはどの種のものが使われているのでしょうか?
Are they home brew, open-source, or COTS with some customization (scripts, etc)?
自家製のものなのか,オープンソース,あるいは(スクリプトなどの)カスタマイズを加えた市販品なのでしょうか?
And if you had to point to one area of network management and say "we could use some improvement or some better tools", what would that area be?
もしネットワーク管理の範疇で「もっと改良できる,あるいはもっと良いツールがあるだろうに」と言えるような点がありましたら,それはどのような点でしょうか?
Craig:
Almost all the technology we use to support our server farm is home-grown.
サーバ群をサポートしている技術のほとんどは,自家製のものです.
The system we've built is so efficient we can maintain more than 10,000 computers with a handful of ops folks.
とても効率よくシステムを築いてきましたので,10,000台を超えるコンピュータを,両手で数えるほどのオペレータでメンテナンスできます.
Of course, we benefit a lot from our massive redundancy:
もちろん,大規模な冗長性には大きな恩恵を受けています.
Unlike many companies, we don't need to worry immediately if a computer, or two, or a hundred, die, because the dead computers have lots of clones.
多くの企業とは違い,コンピュータが一台,二台,あるいは百台死んだとしても,すぐに心配する必要はありません.死んだコンピュータのクローンはたくさんありますからね.
The biggest issue when you have more than 10,000 computers is that network management tools based on visualization become inadequate to the task:
10,000台以上のコンピュータを抱える上での一番の問題は,可視化に基づいた管理ツールが仕事の役に立たなくなるということです.
even if the UI is very good, there's often too much going on (ie,going wrong) to work effectively.
UIがいくら優れていようと,効率的に機能するには行き過ぎてしまう(例えば間違った方向に)ことが多々あるからです.
At this level, you really benefit from tools that can not only identify problems but fix them.
このレベルになると,本当にプラスになるのは問題を指摘するだけのツールではなくて,それを直してくれるものです.
Of course, it's hard to write general tools for this, since "fixing problems" is typically pretty application-specific.
もちろん,そのための一般的なツールを書くのは難しいことです.「問題を直す」ということは通常,非常にアプリケーション固有のものですから.
Craig Silverstein answers your Google questions More ログイン