アカウント名:
パスワード:
(よく知らないのですけれども)メインフレームのCPUは独特な仕様が必要で、信頼性を担保するには独自開発が重要になるのでしょうか?
それとも、大々的に市場に売り出すというよりも、顧客のアテができたから、細々とCPU生産の火を絶やさないためのリリース?
この分野だと、信頼性担保のためにIntelが言うところのMCA、PAL、SAL等といった機能が重要なんです。このうち、MCAはXeon(E7系)にあるんですが、他が無いのでItaniumの代用にできないんだろうと思います。
MCA, PAL, SALって何だろうと思ったら、ブレードで実現する「小規模基幹システム」 [hp.com]と言う解説が。ハードウェア障害を検知すると、それを起こしたプロセッサを殺すシステム?そこら辺のCPUだと、障害起こしてもスルーかそのまま逝っちゃうけど、Itaniumだとしっぽ切って生き残る?
私の知ってるFT機(FT機とメインフレームって違うんだっけ?)だと、CPUボードは3枚積んでました。
で、3枚で常に同じ計算をし、3枚で相互に計算結果を比較しています。2枚から見て、「1枚からの計算結果が違う」と、このCPUボードは自動的に切り離されます。
当然残る2枚で処理は継続するし、「壊れてるらしい1枚を切り離す」際、一切ダウンタイムは出ません。
FTとメインフレームは違うシロモノ障害に備える方針からして違いますよ
FTだと「2重、3重に系を持っていて、壊れているらしい系は切り離す」という対応だと理解しています。メインフレームだと、どんな感じなんでしょう??
メインフレームの基本は予防保守です.
PCレベルでもハードディスクではSMARTなどで不具合にいたらない障害を記録していますが, メインフレームではCPUやメモリ, 各種入出力モジュールでもそうした軽微な障害発生統計を採っています. また電源の変動や温度変化といった外部要因も記録していたりします.
保守契約にもよりますが, そうした統計データをオンラインで保守センターで記録し, 統計的に障害が発生しそうな部品を障害発生前に定期保守で交換します.
こういう統計的な予防保守というのは, それなりの数が出ていないと基礎データが収集できませんし, また各ユーザに近い保守センターを設けないといけないということで, 必然的に高コストになります.
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
普通のやつらの下を行け -- バッドノウハウ専門家
メインフレームに独自CPUを載せる理由について (スコア:0)
(よく知らないのですけれども)メインフレームのCPUは独特な仕様が必要で、
信頼性を担保するには独自開発が重要になるのでしょうか?
それとも、大々的に市場に売り出すというよりも、顧客のアテができたから、
細々とCPU生産の火を絶やさないためのリリース?
Re: (スコア:2, 参考になる)
この分野だと、信頼性担保のためにIntelが言うところのMCA、PAL、SAL等といった機能が重要なんです。
このうち、MCAはXeon(E7系)にあるんですが、他が無いのでItaniumの代用にできないんだろうと思います。
Re: (スコア:1)
MCA, PAL, SALって何だろうと思ったら、
ブレードで実現する「小規模基幹システム」 [hp.com]
と言う解説が。
ハードウェア障害を検知すると、それを起こしたプロセッサを殺すシステム?
そこら辺のCPUだと、障害起こしてもスルーかそのまま逝っちゃうけど、
Itaniumだとしっぽ切って生き残る?
TomOne
Re: (スコア:1)
私の知ってるFT機(FT機とメインフレームって違うんだっけ?)だと、CPUボードは3枚積んでました。
で、3枚で常に同じ計算をし、3枚で相互に計算結果を比較しています。
2枚から見て、「1枚からの計算結果が違う」と、このCPUボードは自動的に切り離されます。
当然残る2枚で処理は継続するし、「壊れてるらしい1枚を切り離す」際、一切ダウンタイムは出ません。
Re: (スコア:0)
FTとメインフレームは違うシロモノ
障害に備える方針からして違いますよ
Re: (スコア:0)
FTだと「2重、3重に系を持っていて、壊れているらしい系は切り離す」という対応だと理解しています。
メインフレームだと、どんな感じなんでしょう??
Re:メインフレームに独自CPUを載せる理由について (スコア:1)
メインフレームの基本は予防保守です.
PCレベルでもハードディスクではSMARTなどで不具合にいたらない障害を記録していますが, メインフレームではCPUやメモリ, 各種入出力モジュールでもそうした軽微な障害発生統計を採っています. また電源の変動や温度変化といった外部要因も記録していたりします.
保守契約にもよりますが, そうした統計データをオンラインで保守センターで記録し, 統計的に障害が発生しそうな部品を障害発生前に定期保守で交換します.
こういう統計的な予防保守というのは, それなりの数が出ていないと基礎データが収集できませんし, また各ユーザに近い保守センターを設けないといけないということで, 必然的に高コストになります.