やっぱり定期的に表面検査とかさせにゃいとディスクすぐエラー吐くよね、ってことで、この辺のシステムのRAIDカードにもちゃんと仕事させようという。
LSI系の場合はMegaCliをDLしてきて
./MegaCli -LDInfo -Lall -aALL
./MegaCli -AdpPr -start -aALL
./MegaCli -LDCC -Start -LALL -aALL
あたりが使える。
infoでgrepしてエラー検知とかその辺で多分動くだろう。
パトロールがちゃんと動くので自動か、cron系で手動startさせればよい。
どーしてもって時には整合性チェックかけてもいい。
Adaptec系の場合は、Adaptec Storage Manager(StorMan)をDLしてきて
./arcconf GETCONFIG 1
./arcconf datascrub 1 period 10 noprompt
./arcconf TASK start 1 LOGICALDRIVE 0 verify_fix noprompt
./arcconf TASK start 1 DEVICE 0 1 verify_fix noprompt
とかだろうか。
にゃんかちゃんと動いてるのかどうか怪しいんだが。
ま週1とか月1で全域readするだけで違ってくるんで、この辺ZFSの思想と違うにゃぁってのが不便でもありおもしろくもある。
罠としか思えんが、デフォで/etc/sysctl.confに妙にゃ値を書き込んであるために、No buffer space availableを吐いて通信できにゃい状況に陥ることがある。意図が分からん。
状況によっていろいろにゃのだが、
sudo echo '8388608' > /proc/sys/net/core/rmem_max
みたいにゃので即改善されるにゃら、カーネルの設定変更で何とかにゃる。数字はとりあえず16777216とかにしてみても良い。
関係しそうにゃのは、
net.core.rmem_max
net.core.wmem_max
net.ipv4.tcp_rmem
net.ipv4.tcp_wmem
あたりだが、ダメにゃら
net.core.rmem_default
net.core.wmem_default
も一応実験。
それから、ARPが溢れてる場合は、
net.ipv4.neigh.default.gc_thresh3=8192
net.ipv4.neigh.default.gc_thresh2=4096
net.ipv4.neigh.default.gc_thresh1=1024
あたりも試してみる価値はある。
Linux汎用の話に近いが、vyattaで設定する場合も/etc/sysctl.confに書いとけばOK