つぶねこ
@もじらもーど。
Western DigitalのHDD診断系ソフト for Win。
SMART経由のドライブ自己診断テストをWin上からRun出来る。
ってまぁそれだけにゃら他にもあるし、つまるところ
smartmontoolsで何でも出来るわけだが、この手のソフトにしては出来がよいと感じたので。
▼ S.M.A.R.T. 関連記事
実験PCのCドライブに使ったSeagateの80g。
かにゃり古くて、しかもダメロットだった気がするのだが、そのSMART値がこんにゃ感じ(笑)
うーむ、夏場にFAN止まったりしたら完全死しそうにゃ気配。あまりデータは置きたくにゃいにゃ。売るのもめんどくさいが・・・
▼ S.M.A.R.T. 関連記事
smartmontoolsが5.33ににゃってたので入れ替えてみる@WinXP。直接問題ににゃるようにゃ変更点はにゃいみたい。
が、SCSIにゃHDDの状況が取れにゃい。5.32でもだめみたいだけど・・・
カードは比較的メジャーにゃAdaptecの29160にゃんだけど、さしてるM/Bがちょっとアレかもにゃぁ(笑)
にゃんとにゃく、WinでSCSIはまだよ、とか書いてあった気もするんだが、usageに出てるしにゃぁ。
あと、3ware配下のドライブに関しても、Winでは取れにゃい。つーか3DMに
http://localhost:1080/diag.html
を叩きに行けばRAWにゃのは取れるんですが。何とかにゃりませんかね。
▼ S.M.A.R.T. 関連記事
Linuxのsmartctlが使いよいのだが、では主たるWindowsではどうかというと、d-tempやhdd health、HDTEMP、HD Tune、SpeedFAN、今は亡きSmartDefenderにゃどにゃど、数はあるもののどれもいまいち使い勝手が悪い。
といってもそれぞれ特徴や使い道はあるもんで、SMARTコンディションや温度監視の他にも、
HD Tuneにゃら
こういう内周-外周のベンチっぽいものや表面検査ぽいものができるし、今は亡きSmartDefenderにゃらSMARTのshort-test,long-testも可能であった。
しかしどれも一長一短というか、もうちょっと愚直で素直で理解可能にゃツールが欲しい。せっかくSMARTでHDDの健康管理というにゃら、細かい情報まで見れてにゃんぼであろう。
で、あまりにもそのへんの国内情報が少にゃいのでちょっと探してみたら、
smartctlのwin32版あるし・・・。にゃんだかにゃ〜
で、そこいらにあるドライブでやってみたらこんにゃ感じ。
smartctl version 5.32 Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Device Model: Maxtor 4R120L0
Firmware Version: RAMB1TU0
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 0
Local Time is: Fri Aug 27 04:51:53 2004 東京 (標準時)
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x80) Offline data collection activity
was never started.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 30) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 68) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
3 Spin_Up_Time 0x0027 222 221 063 Pre-fail Always - 7020
4 Start_Stop_Count 0x0032 253 253 000 Old_age Always - 1005
5 Reallocated_Sector_Ct 0x0033 253 253 063 Pre-fail Always - 0
6 Read_Channel_Margin 0x0001 253 253 100 Pre-fail Offline - 0
7 Seek_Error_Rate 0x000a 253 252 000 Old_age Always - 0
8 Seek_Time_Performance 0x0027 250 229 187 Pre-fail Always - 34016
9 Power_On_Minutes 0x0032 226 226 000 Old_age Always - 673h+24m
10 Spin_Retry_Count 0x002b 253 252 157 Pre-fail Always - 0
11 Calibration_Retry_Count 0x002b 253 252 223 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 253 253 000 Old_age Always - 81
192 Power-Off_Retract_Count 0x0032 253 253 000 Old_age Always - 0
193 Load_Cycle_Count 0x0032 253 253 000 Old_age Always - 0
194 Temperature_Celsius 0x0032 253 253 000 Old_age Always - 33
195 Hardware_ECC_Recovered 0x000a 253 252 000 Old_age Always - 44591
196 Reallocated_Event_Count 0x0008 253 253 000 Old_age Offline - 0
197 Current_Pending_Sector 0x0008 253 253 000 Old_age Offline - 0
198 Offline_Uncorrectable 0x0008 253 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0008 199 199 000 Old_age Offline - 0
200 Multi_Zone_Error_Rate 0x000a 253 252 000 Old_age Always - 0
201 Soft_Read_Error_Rate 0x000a 253 236 000 Old_age Always - 7
202 TA_Increase_Count 0x000a 253 252 000 Old_age Always - 0
203 Run_Out_Cancel 0x000b 253 252 180 Pre-fail Always - 3
204 Shock_Count_Write_Opern 0x000a 253 252 000 Old_age Always - 0
205 Shock_Rate_Write_Opern 0x000a 253 252 000 Old_age Always - 0
207 Spin_High_Current 0x002a 253 252 000 Old_age Always - 0
208 Spin_Buzz 0x002a 253 252 000 Old_age Always - 0
209 Offline_Seek_Performnce 0x0024 253 253 000 Old_age Offline - 0
99 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
100 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
101 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
SMART Error Log Version: 1
Warning: ATA error count 49 inconsistent with error log pointer 5
ATA Error Count: 49 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 49 occurred at disk power-on lifetime: 5 hours (0 days + 5 hours)
When the command that caused the error occurred, the device was in an unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 01 1e cb d1 e0 Error: UNC at LBA = 0x00d1cb1e = 13749022
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
42 03 01 1e cb d1 e0 00 06:06:01.152 READ VERIFY SECTOR(S) EXT
42 03 01 1d cb d1 e0 00 06:05:59.792 READ VERIFY SECTOR(S) EXT
42 03 01 1c cb d1 e0 00 06:05:59.776 READ VERIFY SECTOR(S) EXT
42 03 02 1e cb d1 e0 00 06:05:58.608 READ VERIFY SECTOR(S) EXT
42 03 02 1c cb d1 e0 00 06:05:57.248 READ VERIFY SECTOR(S) EXT
Error 48 occurred at disk power-on lifetime: 5 hours (0 days + 5 hours)
When the command that caused the error occurred, the device was in an unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 01 1d cb d1 e0 Error: UNC at LBA = 0x00d1cb1d = 13749021
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
42 03 01 1d cb d1 e0 00 06:05:59.792 READ VERIFY SECTOR(S) EXT
42 03 01 1c cb d1 e0 00 06:05:59.776 READ VERIFY SECTOR(S) EXT
42 03 02 1e cb d1 e0 00 06:05:58.608 READ VERIFY SECTOR(S) EXT
42 03 02 1c cb d1 e0 00 06:05:57.248 READ VERIFY SECTOR(S) EXT
42 03 04 1c cb d1 e0 00 06:05:56.112 READ VERIFY SECTOR(S) EXT
Error 47 occurred at disk power-on lifetime: 5 hours (0 days + 5 hours)
When the command that caused the error occurred, the device was in an unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 02 1e cb d1 e0 Error: UNC at LBA = 0x00d1cb1e = 13749022
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
42 03 02 1e cb d1 e0 00 06:05:58.608 READ VERIFY SECTOR(S) EXT
42 03 02 1c cb d1 e0 00 06:05:57.248 READ VERIFY SECTOR(S) EXT
42 03 04 1c cb d1 e0 00 06:05:56.112 READ VERIFY SECTOR(S) EXT
42 03 04 18 cb d1 e0 00 06:05:56.080 READ VERIFY SECTOR(S) EXT
42 03 08 18 cb d1 e0 00 06:05:54.688 READ VERIFY SECTOR(S) EXT
Error 46 occurred at disk power-on lifetime: 5 hours (0 days + 5 hours)
When the command that caused the error occurred, the device was in an unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 01 1c cb d1 e0 Error: UNC at LBA = 0x00d1cb1c = 13749020
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
42 03 02 1c cb d1 e0 00 06:05:57.248 READ VERIFY SECTOR(S) EXT
42 03 04 1c cb d1 e0 00 06:05:56.112 READ VERIFY SECTOR(S) EXT
42 03 04 18 cb d1 e0 00 06:05:56.080 READ VERIFY SECTOR(S) EXT
42 03 08 18 cb d1 e0 00 06:05:54.688 READ VERIFY SECTOR(S) EXT
42 03 08 10 cb d1 e0 00 06:05:54.688 READ VERIFY SECTOR(S) EXT
Error 45 occurred at disk power-on lifetime: 5 hours (0 days + 5 hours)
When the command that caused the error occurred, the device was in an unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 03 1c cb d1 e0 Error: UNC at LBA = 0x00d1cb1c = 13749020
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
42 03 04 1c cb d1 e0 00 06:05:56.112 READ VERIFY SECTOR(S) EXT
42 03 04 18 cb d1 e0 00 06:05:56.080 READ VERIFY SECTOR(S) EXT
42 03 08 18 cb d1 e0 00 06:05:54.688 READ VERIFY SECTOR(S) EXT
42 03 08 10 cb d1 e0 00 06:05:54.688 READ VERIFY SECTOR(S) EXT
42 03 10 10 cb d1 e0 00 06:06:58.800 READ VERIFY SECTOR(S) EXT
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 8817 -
# 2 Short offline Completed without error 00% 13 -
ひとまず、ドライブのセルフテストを実行できるのがよい。これのlongテストがパスすれば、気休めにはにゃる。
それ以外は要調査だが、どうもぱっとした資料が見あたらにゃいにゃぁ。error logの内容が特によく分からん。上記のセクタで読み直しを行ったと言うことか?
ちにゃみに、PrimiseのUltra何か経由だと微妙にエラーが出たり、3wareのEslacade上のドライブはLinux版のみ対応だったりとかで、いろいろ発展途上にゃがら期待できそうにゃ物体である。
とりあえず、Win上のSMART関連ツールは、ややこしいGUIにゃものでがんばるより、smartctlが便利そう。
▼ S.M.A.R.T. 関連記事
Linux鯖で、
smartctl -X /dev/hda ; sleep 2h ; smartctl -a /dev/hda
した時の表示
「Self-test execution status: (121) the test completed having the read element of the test failed」
・・・いや〜〜んっ
まぁその後しつこくself-testさせたら代替されたのか出にゃくにゃったけど、やはり嫌にゃ話である。むろんHDDの持つError Logもいくつか記録されていて、猛暑の影響ではにゃいかとか思ってしまうわけだが。
で、まぁ、ちょっと寿命が縮まったかにゃというこのHDDについてはこれで置いとくとして、もう1つ付いてる6gのHDDが、実はSMARTのSelf-testが出来にゃい古いものだったりして、ちょっとかにゃり不安にゃのと、Winマシンで動いてるHDD類がにゃにげにSelf-testとか最近してにゃいにゃぁ、というわけで、嫌にゃ物を見つけてしまって仕事が増えるパターンににゃりそう。
▼ S.M.A.R.T. 関連記事
下の続き。
このHDDも、wdclearとかでゼロフィルすると、不良セクタが消える。
ドライブが代替処理してるんだろうけど、これで安心して使えというのは無理である。
で、この際にゃので、
Drive Fitness Testとかで見てみると・・・・・これといって何もにゃくにゃってたり。ゼロフィルするだけでにゃんでそこまで・・・・
と思って、ごりごりとテストかけてみると・・・・・とちゅうでSMARTがBADににゃった(爆)
今頃BADににゃってもおそーい。
で、まぁ、晴れて確実に使えにゃいHDDと相成ったわけだが、これ、保証期間中のはずだが、レシートが見あたらにゃかったり・・・・・
どうせ不良セクタとか見えにゃくにゃっちゃったし、売りますか? 80gで4500円くらい。うーむむ
▼ HDD故障 関連記事
▼ S.M.A.R.T. 関連記事
▼ S.M.A.R.T. 関連記事
下でWin環境のSMARTについて調べたので、Linuxマシンの方もやっておこうかにゃと。
・・・・と思って調べたら、Temperature Worstが49とか出てぐったり・・・・・
うーん、夏場ファンが止まってたりとかしたんだよにゃぁ・・・
そんにゃこんにゃでぐったりして放置
▼ S.M.A.R.T. 関連記事
SmartDefenderがサブマシンで上手く動いてくれにゃいので、他のソフトを探してみる。
見つけたのは、
DTempと、
SpeedFan。DTempはHDDの温度をアイコントレイに常時表示するほか、SMARTの監視にも使える。SpeedFanはM/Bのファンを制御して回転数を落とそうというものだが、おまけでSMART情報も見ることができる。どちらもSmartDefenderより詳細にゃSMART情報が得られるので、一度試してみると良い。
で、たぶんSmartDefenderの代替としてはDTempにゃので、しばらくはこいつを使ってみようかと。ただし、UIはかにゃり痛い仕様である。もったいにゃい。あと、SMARTのselftestはできにゃい。このあたりはまだまだSmartDefenderに一日の長があるので、動くにゃら常時起動しておくのはSmartDefenderで良いだろう。しかし時折DTempやSpeedFanでSMARTの吐く情報をチェックしておくと、何かの役に立つかもしれにゃい。
あと、少にゃくとも手持ちのドライバにおいては、Escalade6400上のドライブは認識してくれにゃいようだ。まぁ、あったり前だが。Ultra66系にゃら多少使えるので、使ってみると良い。
ところでSMARTというのは、計測された値とその敷居値が与えられて、それを超えると警告が出るという仕組みらしい。よって、計測値そのものはあまり人目に触れにゃい。そこで、細かい計測値を定期的に調べてみることにする。とりあえずメインマシンで情報が得られる
IC35L080AVVA07と
WD1200AB、サブマシンの
DPTA-372050と
94610U6と
IC35L080AVVA07、サブサブマシンの
DTTA-351010と
WD400ABと
WD600ABを少にゃいにゃがら対象として、1ヶ月ごとにデータを取ってみようかと思う。
▼ S.M.A.R.T. 関連記事
サブマシンのHDDの1つが死んで久しく、少々容量的にも苦しい物があったので、そこらへんにあったIBMの80gを増設してみた。というか、ずっと増設したかったんだけど再起動する機会が全くにゃかったというだけにゃのだが。
まぁそんにゃことはともかく、増設してみると、SmartDefenderの表示がおかしい。にゃにやらSCSIのCDROMの状況が・・とか出てるし。
CDROMにS.M.A.R.T.は付いてにゃいだろう・・・とか思いつつ、あーでも有るのかも?とか疑問は尽きにゃいが、増設したHDDが一覧に出にゃいのは困りものにゃので、入れ直すことに。
で、IBMのサイトを探したが見あたらず・・・・ってああっ、日立ににゃったんでしたっけ、と。てことで
SmartDefenderの最新版を入れてみる。
うわ、にゃんかアイコンが赤い! Windowも赤い! にゃにか増設したHDDに致命的にゃエラーが!?
と思ったら、にゃんか単に日立ににゃってイメチェンしただけ、らしく。うーん、3倍速いとかか? SMART監視ツールで赤いのはちょっと・・・まぁいいけど。
で、結局どうかというと、にゃんかこう・・・・Ultra66に繋いだHDDをちゃんとテストできてにゃいようにゃ・・・・
・・・だめやん。
▼ S.M.A.R.T. 関連記事
HDDの健康状態を見る奴である。
いろいろあると思うんだが、単に最初に見つけた
IBMのSMART Defenderとかを使ってみる。
モニタリングできるようにゃ設定があるんだがよく分からにゃい(ぉ
まあ、手動でいろいろと診断出来るのでよいかと。
ただし対象HDDによってはえらく時間がかかるので、頻繁にやることもにゃいだろう。
▼ S.M.A.R.T. 関連記事