Linux上使⽤SMART检测硬盘
SMART(Self-Monitoring, Analysis, and Reporting Technology)是⼀种普及度⽐较⾼的磁盘分析检测⼯具,磁盘运⾏过程中,该⼯具搜集磁盘的状态参数,如型号、容量、温度、密度、扇区、寻道时间、传输、误码率等。可以做到动态检测磁盘状态,当某些参数达到阈值时,会警⽰磁盘故障。
SMART包括2个⼯具,守护进程smartd和应⽤程序smartctl。守护进程⽤来检测、监控、分析、上报磁盘信息,有对应的配置维护。smartctl ⽤以检查磁盘的运⾏状态信息。
下⾯简单列举smartctrl的常⽤⽤法:
smartctl -a #检查是否启⽤smart
smartctl -s on #启⽤smart
记住我smartctl -H #检查磁盘健康状况
smartctl -A #查看硬盘的详细信息
smartctl -t long #后台检测,消耗时间长
smartctl -t short #后台检测,消耗时间短
smartctl -C -t #前台检测硬盘,CPU、内存消耗
smartctl -X #中断后台检测硬盘
smartctl -l selftest #显⽰硬盘检测⽇志
smartctl -l error #显⽰硬盘错误汇总
⼀般会在守护进程smartd中配置⼀些⾼级功能,⽐如,定时检测、分析汇总、上报等。可以编辑f进⾏配置。常⽤的配置项:1. 邮件告警
/dev/sda -a -m admin@example,root@localhost #监控磁盘的所有属性,出现 Failure,邮件通知
/dev/sda -H -m admin@example,root@localhost #监控磁盘的健康状态,出现 Failure,邮件通知
/dev/sdb -m admin@example -M test #启⽤时,发送test消息
2. 定时检测