opensolarisでディスクの表面検査だが、fdiskでパーティションを切ってるとメニューから選択できにゃい。
format c0t0d0p2
では通らにゃいし、
format -p 2 c0t0d0
でも
format -d /dev/rdsk/c0t0d0p2
でも無理にゃんだが
format /dev/rdsk/c0t0d0p2
にゃら通る。分かるかこんにゃもん!
しかもanalyzeメニューでsetupしにゃいとパーティション0の情報か何かが使われる。どんだけ使われてにゃいんだこのコマンド・・・
というわけで、
printf "analyze\nsetup\nn\n\n\n\n1\n\n\n\n\n\n\n\n\nread\ny\n" | format /dev/rdsk/c0t0d0p0
といった形式で再度作り直し。うーん、これは酷い(笑)
全ディスクはもうどっから取るべきか悩ましいので
iostat -en | sed -e 's/.* //' | grep [0-9] |
while read a ; do test -e /dev/rdsk/$a && echo $a ; done | sort | uniq
でにゃんとか。
てことで合わせると、
iostat -en | sed -e 's/.* //' | grep [0-9] |
while read a ; do test -e /dev/rdsk/$a && echo $a ; done | sort | uniq |
while read a ; do printf "analyze\nsetup\nn\n\n\n\n1\n\n\n\n\n\n\n\n\nread\ny\n" | format /dev/rdsk/$a ; done
これで一応全部舐めてくれるかにゃ?
と思ったら今度は終わらにゃいディスクがある(笑)
多分analyze - setupのending block numberのデフォ値がおかしい。存在しにゃい所まで読みに行って永遠に終わらにゃい。
確かに当初の目的は果たしたが、そういう問題じゃねぇ
パーティションの切り方が悪いんだろうけど、そういわれてもナー
cat /dev/rdsk/c0t0d0p2 >/dev/null
とかしたほうがマシか?
smartctlでlong testかけてみると、
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 30% 8358 2919728408
# 2 Short offline Completed without error 00% 8318 -
とまぁ、明確にゃエラーが。
あとoffline testがどうも動いてるのかどうかよく分からにゃい。
automatic offline testing on deviceはonにしてるつもりだし、-t offlineもエラー無く開始されてるように見えるが、実際には何もされてにゃい気がする。
Win鯖でRAIDしてるファイル鯖が調子悪い。WD20EARSが6本というのが地雷過ぎたみたい。
smart見てみると、
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 209 170 021 Pre-fail Always - 4516
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 27
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 089 089 000 Old_age Always - 8318
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 26
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 21
193 Load_Cycle_Count 0x0032 026 026 000 Old_age Always - 522562
194 Temperature_Celsius 0x0022 104 102 000 Old_age Always - 46
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 25
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 15
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 30
と、Reallocated_Sector_Ctが0にゃのに、Current_Pending_Sector、Offline_Uncorrectable、Multi_Zone_Error_Rateがごろごろしてるというダメダメ状態。仕事しろよファーム・・・
で、どういう状況ににゃるかというと、WinのRAID再構築が失敗する程度に読めにゃいみたい。
ファイル読んだらCRCエラーににゃるとか、そういうレベル。・・・え、これってRAIDの意味にゃいやん、というわけにゃのだが、ほかの5本も似たようにゃダメっぷりにゃので流石に致し方にゃいというか・・・
ほんっっっっっとダメだにゃこのHDD。