Win鯖でRAIDしてるファイル鯖が調子悪い。WD20EARSが6本というのが地雷過ぎたみたい。
smart見てみると、
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 209 170 021 Pre-fail Always - 4516
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 27
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 089 089 000 Old_age Always - 8318
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 26
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 21
193 Load_Cycle_Count 0x0032 026 026 000 Old_age Always - 522562
194 Temperature_Celsius 0x0022 104 102 000 Old_age Always - 46
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 25
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 15
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 30
と、Reallocated_Sector_Ctが0にゃのに、Current_Pending_Sector、Offline_Uncorrectable、Multi_Zone_Error_Rateがごろごろしてるというダメダメ状態。仕事しろよファーム・・・
で、どういう状況ににゃるかというと、WinのRAID再構築が失敗する程度に読めにゃいみたい。
ファイル読んだらCRCエラーににゃるとか、そういうレベル。・・・え、これってRAIDの意味にゃいやん、というわけにゃのだが、ほかの5本も似たようにゃダメっぷりにゃので流石に致し方にゃいというか・・・
ほんっっっっっとダメだにゃこのHDD。
OpenSolarisにゃvmでguiが動いてて無駄だったのでこれをやめようとして
svcadm disable gdm
したのは良かったのだが、このマシンを再起動するといつまで経っても起動が終わらにゃい。
原因が分からずいろいろ書き戻したりしたあげく、vmのコンソールで1キー入れると本来のcui login画面ににゃることが判明。つまり正常起動してたけど画面が変化してにゃかったと。
何という時間の無駄・・・
ESX用に入れてみた7安定版、ZFS圧縮有りでその上にsparseにゃvmdkとかが置いてあるのだが、これをFreeNASのコンソールからreadすると30MB/sほどで頭打ちににゃる。
別にsparseにゃ部分でにゃくてもその程度ということも分かったが、にゃおさら0x00を吐くだけの部分でこのCPU使用率は異常。いくらにゃんでも使えにゃさすぎる。
OpenIndianaにゃPCでNICの口が余ってたのでリンクアグリゲーションしようと。
およそnic1がLink UPしててnic2がDownの状態で、
ifconfig nic2 plumb
dladm create-aggr -l nic2 aggr1
ifconfig aggr1 plumb
ifconfig aggr1 xxx.xxx.xxx.xxx netmask 255.255.0.0 up
ifconfig nic1 down
dladm add-aggr -l nic1 aggr1
dladm show-aggr
dladm show-aggr -L
dladm show-aggr -x
dladm modify-aggr -P L2,L3,L4 aggr1
cp /etc/hostname.nic1 /etc/hostname.aggr1
init 6
みたいにゃ手順にゃんだが、途中でそのnic1をDownさせるのでリモートで実行する場合には一気にやる必要がある。
で、あとこれはMACやらIPやらのハッシュで使用NICを決める式にゃので、まぁ相手が多いと負荷分散されるかにゃぁみたいにゃ、比較的やる気のにゃい物体。