アカウント名:
パスワード:
ストレージ内に収めるHDD。コントローラのソフトウェアは上から順番に1・2・3…と認識するが、ハードウェアが認識するのは下から順番に1・2・3…。でもって、コントローラが「No2のHDDに異常発生!No2緊急停止!!」との命令を実行したところ実際に機能停止したのは別のHDDのだった…とか。
説明読みましょうよ。
1と2のHDDがあって1で断続的なエラーがあった。けれどエラー判定で応答速度だけを基準としていたことと、1でエラーがおさまっている時にその判断が行われたため応答速度の遅かった2の方でエラーが発生していると判断して2を遮断、その後1がダウン、ってことらしい。
外野だが、
応答速度が速い壊れたHDDと応答速度が遅いが正確なHDD
どちらも故障の範囲では?
最近のHDDのファームは内部でリトライを相当繰り返す仕様になってるみたいでI/Oエラーを持って異常とみなすシステムでは故障検知に時間がかかる事例は増えているようです。
> リトライ回数の上限とか、自動代替する/しないとか。でも、HDD上の制御LSIが故障すると、バスをつかんだまま止まったり。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日本発のオープンソースソフトウェアは42件 -- ある官僚
意外と単純なミスかも (スコア:0)
ストレージ内に収めるHDD。
コントローラのソフトウェアは上から順番に1・2・3…と認識するが、ハードウェアが認識するのは下から順番に1・2・3…。
でもって、コントローラが「No2のHDDに異常発生!No2緊急停止!!」との命令を実行したところ実際に機能停止したのは別のHDDのだった…とか。
Re: (スコア:1, すばらしい洞察)
説明読みましょうよ。
1と2のHDDがあって1で断続的なエラーがあった。
けれどエラー判定で応答速度だけを基準としていたことと、1でエラーがおさまっている時にその判断が行われたため
応答速度の遅かった2の方でエラーが発生していると判断して2を遮断、その後1がダウン、ってことらしい。
Re: (スコア:0)
外野だが、
応答速度が速い壊れたHDDと
応答速度が遅いが正確なHDD
どちらも故障の範囲では?
Re: (スコア:2, 興味深い)
Re:意外と単純なミスかも (スコア:1, 興味深い)
最近のHDDのファームは内部でリトライを相当繰り返す仕様になってるみたいで
I/Oエラーを持って異常とみなすシステムでは故障検知に時間がかかる事例は増えているようです。
Re:意外と単純なミスかも (スコア:2, 興味深い)
リトライ回数の上限とか、自動代替する/しないとか。
今はSATAの、しかもデスクトップPC向けHDDを積んだインチキなシロモノがありますので注意。
デスクトップPC向けだと、延々とリトライするのが適切な動作ですから。
RAID向けHDDだとリトライ回数を抑制して一定時間以内にエラー応答を返すようになってます。
ていうか、SAS使ってください。
Re: (スコア:0)
> リトライ回数の上限とか、自動代替する/しないとか。
でも、HDD上の制御LSIが故障すると、バスをつかんだまま止まったり。
Re: (スコア:0)
Re: (スコア:0)