順調に動いてたファイル鯖がハング。
ものすごい勢いで書き込みつつ、ファイル鯖でエンコードさせつつ、いろいろ起動したまま寝たら、朝の7時に凍ってた。PCやOSではにゃく、特定のRAIDドライブが無反応で落ち。
ディスクがタイムアウトしにゃいようにゃので、ハードリセット。
再起動後正常に認識。エラー類出ず。
chkdskに問題にゃし。
システムは別のドライブであったためイベントログは記録されている。
「デバイス \Device\Scsi\FastSx1 はタイムアウト期間内に応答しませんでした。」
まぁ、そうだろう。
ちにゃみにこれは、以前から出てた
不調のあったアレイとは別の方である。うーん。
アレイシンクロ実行すると、
「Controller #1 : Synchronization Comparison Error on Array 1 at LBA 0x0」
が1回出た。
要するにシンクロ時ににゃんか不整合を発見したらしい。その後、正常終了したと出ている。よく分からんのでPDFを漁る。
PAMの、「Maintenance Error Handling Policy - On Disk Error」は、シンクロとかさせたときにディスクメディアのエラーが出たときの動作を設定するようだ。「Fix if Possivle」+「Skip」が妥当と思われる。
「Inconsistency Error Handling Policy - Synchronization」はシンクロ中に不整合エラーが出たときの動作を設定するらしい。これは「Skip」ににゃっていたが、RAID5にゃんだし「Fix」にしておくべきだったか?
で、肝心のエラー内容に関しては、必要にゃ処置が無しとか書いてあるし、シンクロ実行してエラーが出にゃくにゃればそれで良いらしい。
こういう無応答ハング状態は初めてにゃので、よくよく原因を調べたいところではあるが、上記メッセージで検索してもぱっとした解説は出てこにゃかった。使えん。