アカウント名:
パスワード:
産経の記事やreoさんのコメントなどを基にまとめてみます。ただ、詳しい資料があまりないので今回の障害に詳しい方、もしよろしければ補足をお願いします。1. 昨年7月に落雷事故。関連がある可能性はあるが確証は得ていない。2. 昨年8月から10月まで障害が発生。影響を受けたデータは15万件。3. ほとんどのデータはコピーが無事だったので復旧できた。約1072件はコピーも破損したので消えた。(4. この際コピーの破損を検測できず、または検測せずに全データを復旧したと思い込んだ?)5. その後、半年に渡って気づかれなかった。原因は不明。(推測ですが、破損したデータの利用頻度が低い、または自前のソフトのバグだと思って再計算したら直ったので無視した?)6. reo氏はデータのハッシュをローカル保存したので今年3月にデータ破損を発見、指摘。7. 産経の取材で今発表する。
> 3. ほとんどのデータはコピーが無事だったので復旧できた。約1072件はコピーも破損したので消えた。
あってます。ちなみに、このコピーは、ユーザーがとっていたものではなく、ストレージシステム側で、複数のサーバーに自動複製されていたものです。1072件については、障害の発生していたストレージがマスターとなって複製されたため、自動複製されたデータまで壊れていてダメだったんだと思います。
> 5. その後、半年に渡って気づかれなかった。原因は不明。
今回の障害は、ディスクへの書き込みは成功し、またディスクからの読み出しも成功するがデータは化けているとい
障害の発生していたストレージがマスターとなって複製されたとのことですが、これってレプリケーション前でマスターしかないタイミングだったのかバグったデータで正常なデータが上書きされたのか。
後者だったら対策されたんでしょうか。
> これってレプリケーション前でマスターしかないタイミングだったのか> バグったデータで正常なデータが上書きされたのか
前者です。既にデータがあるのに上書きして再度複製処理をするのは無駄ですから、そもそもそういう処理は起きません。
了解です。だとすると、「コピーも破損した」でなく「正常なコピーが存在しなかった」のような。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」
時系列でまとめてみる (スコア:5, 参考になる)
産経の記事やreoさんのコメントなどを基にまとめてみます。ただ、詳しい資料があまりないので今回の障害に詳しい方、もしよろしければ補足をお願いします。
1. 昨年7月に落雷事故。関連がある可能性はあるが確証は得ていない。
2. 昨年8月から10月まで障害が発生。影響を受けたデータは15万件。
3. ほとんどのデータはコピーが無事だったので復旧できた。約1072件はコピーも破損したので消えた。
(4. この際コピーの破損を検測できず、または検測せずに全データを復旧したと思い込んだ?)
5. その後、半年に渡って気づかれなかった。原因は不明。(推測ですが、破損したデータの利用頻度が低い、または自前のソフトのバグだと思って再計算したら直ったので無視した?)
6. reo氏はデータのハッシュをローカル保存したので今年3月にデータ破損を発見、指摘。
7. 産経の取材で今発表する。
Re: (スコア:5, 参考になる)
> 3. ほとんどのデータはコピーが無事だったので復旧できた。約1072件はコピーも破損したので消えた。
あってます。
ちなみに、このコピーは、ユーザーがとっていたものではなく、
ストレージシステム側で、複数のサーバーに自動複製されていたものです。
1072件については、障害の発生していたストレージがマスターとなって複製されたため、
自動複製されたデータまで壊れていてダメだったんだと思います。
> 5. その後、半年に渡って気づかれなかった。原因は不明。
今回の障害は、ディスクへの書き込みは成功し、またディスクからの読み出しも成功するが
データは化けているとい
Re: (スコア:0)
障害の発生していたストレージがマスターとなって複製されたとのことですが、
これってレプリケーション前でマスターしかないタイミングだったのか
バグったデータで正常なデータが上書きされたのか。
後者だったら対策されたんでしょうか。
Re: (スコア:0)
> これってレプリケーション前でマスターしかないタイミングだったのか
> バグったデータで正常なデータが上書きされたのか
前者です。
既にデータがあるのに上書きして再度複製処理をするのは無駄ですから、
そもそもそういう処理は起きません。
Re:時系列でまとめてみる (スコア:0)
了解です。
だとすると、「コピーも破損した」でなく「正常なコピーが存在しなかった」のような。