h-harryの日記: [悪1号] ZFS Resilever 2
FreeBSDでraid-z2(WD Red 4T x 4 + 4T spare)で構成しているpoolの1台のReallocated_Event_Countが増えてきたので手動でreplaceかけた。
まあ、お約束でresilver中に
(ada2:ahcich2:0:0:0): Retrying command, 3 more tries remain
ahcich2: Timeout on slot 17 port 0
ahcich2: is 00000000 cs 00020000 ss 00000000 rs 00020000 tfd c0 serr 00000000 cmd 0000d117
(ada2:ahcich2:0:0:0): FLUSHCACHE48. ACB: ea 00 00 00 00 40 00 00 00 00 00 00
(ada2:ahcich2:0:0:0): CAM status: Command timeout
(ada2:ahcich2:0:0:0): Retrying command, 0 more tries remain
ahcich2: AHCI reset: device not ready after 31000ms (tfd = 00000080)
ada2 at ahcich2 bus 0 scbus2 target 0 lun 0
ada2: s/n WD-WCCxxxxxxxxxxxxxx detached
(ada2:ahcich2:0:0:0): Periph destroyed
(aprobe0:ahcich2:0:0:0): NOP FLUSHQUEUE. ACB: 00 00 00 00 00 00 00 00 00 00 00 00
と取り外されてしまった。
まあ、そこまではいいけど、朝からresilverが全然進まん
scan: resilver in progress since Sun Oct 17 10:11:26 2021
610G scanned at 5.84M/s, 609G issued at 5.82M/s, 6.33T total
148G resilvered, 9.39% done, no estimated completion time
..
raidz2-0 DEGRADED 0 0 0
spare-0 DEGRADED 0 0 1.03K
7751662144230070271 REMOVED 0 0 0 was /dev/gpt/disk1
gpt/disk5 ONLINE 0 0 0
ダメになったHDDは物理的に取り外したほうがいいのか。
無いとは思いますが (スコア:0)
RAIDならCMR確定でないと怖すぎるので
未確認運用はまず無いとはおもいますが
WDは色と容量だけではCMRかSMRかは判別できず
型番から発売年代を調べるか
型番後半にArchiveHDDを示す「A」が入っているか(憶測)
もしくはキャッシュ256MBなら怪しいとか(憶測)
で判断する必要があります。
/*
WD、SGは無表記ならほぼSMRな販売になってきているので
調べるの面倒なら東芝あたりがSMRを引く可能性が低いかと
*/
Re:無いとは思いますが (スコア:1)
全部、CMRです。1台除いてRMAの期限もとっくに過ぎてます。
壊れたHDD(もうREMOVEDされたの関係ないですが)
交換用のRedも1台あって、こちらもCMRです。
って書いておいてspareに割り当てていたHDDはどっちだ?
RMAでの交換品だったので知らないや。ちょっとWarranty Statusで確認してみると
64MなのでCMRですね。
CMRが手に入るうちに幾つか買っておくかな。