R. Cap. Leovigildo Silvério Gomes dos Reis 210,

04069-030, SP

S.m.a.r.t. – Atributos, Valores e Significados 

Sempre que temos um problema que aparenta ser falha do HD, dizem para olharmos os dados do SMART.

Mas o que o SMART tem a ver com o HD? O que ele indica? E o que é SMART?

Nesse artigo vou procurar mostrar um pouco sobre o que é SMART e o que ele representa na saúde do HD, sempre lembrando que essa matéria foi colhida de fontes externas, sendo preservadas no final para os devidos créditos.

O que quer dizer S.M.A.R.T.?

Self-Monitoring, Analysis and Reporting Technology Auto-Análise Monitorada e Relatório de Tecnologia

A origem do SMART

Foi em 1992 que a IBM introduziu em seus discos rígidos uma tecnologia capaz de prever com antecedência sua própria falha: era o Predictive Failure Analysis (PFA), que pouco tempo depois tornou-se a tecnologia-padrão para monitoramento de falhas em discos rígidos, sendo adotada por todos os outros fabricantes à partir de 1996 (com a implementação do padrão ATA-3) com o nome de Self-Monitoring, Analysis and Reporting Technology, ou simplesmente S.M.A.R.T..

Como funciona?

O SMART nada mais é que um programa na placa controladora do disco rígido. Este programa permite que sejam recuperados os dados sobre operações de ordem mecânica consideradas "vitais" para o funcionamento do disco rígido, bem como o estado dos componentes envolvidos nestas operações (motor de rotação, superfícies graváveis, cabeças físicas, etc.).

Este monitoramento baseia-se numa lista de falhas consideradas previsíveis (“predictable faults”) que podem ocorrer por desgaste dos componentes mecânicos.

Porém existem também as falhas consideradas como não previsíveis (“unpredictable faults”), as quais podem ocorrer subitamente, sem que o SMART consiga detectá-las. Por exemplo, um dano na placa controladora causado por eletricidade estática, pode ser classificado como “unpredictable fault”.

Segundo dados dos fabricantes, cerca de 60% das falhas em discos rígidos são de origem mecânica, sendo o choque mecânico das cabeças físicas de leitura/gravação contra a superfície magnética, falha do motor e desprendimento do verniz do disco, são as causas mais comuns.

Os restantes das causas de falhas são das mais diversas, incluindo componentes eletrônicos (chips ou circuitos da placa lógica ou de partes internas) inutilizados por eletricidade estática ou superaquecimento, ou mesmo algum defeito de fabricação e fadiga.

De fato, grande parte dos defeitos em discos rígidos está diretamente ligada ao manuseio incorreto, mas independente de origens e causas dos defeitos, o SMART pode avisar através dos valores de seus atributos o que exatamente está para falhar.

Nas placas-mãe atuais, é possível ativar no setup do BIOS um programa residente, que checa os valores dos atributos do SMART durante o POST. Dependendo do fabricante do BIOS, é possível ver uma opção com os dizeres "S.M.A.R.T. for Hard Disks", podendo ser habilitada (Enabled) ou não (Disabled).

Se o SMART estiver habilitado no setup do BIOS da placa-mãe, o programa residente vai recuperar os valores dos atributos do SMART apenas no POST, avisando com algum tipo de mensagem caso haja algum atributo com valor fora do limite.

Isso é muito útil pois, se acaso houver algum problema que possa ser agravado ainda mais com o uso do disco rígido, o aviso do SMART pode evitar maiores prejuízos, havendo tempo de enviar o disco rígido à uma assistência especializada para uma tentativa de recuperação dos dados.

Apesar de algumas BIOS oferecerem avisos como "System performance may decrease if enabled", habilitar o SMART não prejudica o desempenho, uma vez que o monitoramento só ocorre no POST e não durante todo o uso da máquina.

É falsa a idéia de que o SMART monitora o disco rígido o tempo todo e gera logs: os valores dos atributos do SMART tem que ser lidos por algum programa, pois o SMART por si só não faz isso de forma independente.

Mesmo que o SMART esteja desabilitado no setup do BIOS da placa-mãe, ou mesmo que a placa-mãe não tenha essa opção, é possível verificar os atributos em discos rígidos que tenham a tecnologia através de softwares específicos para esse fim

Entendendo os valores de atributos fornecidos pelo SMART

Os atributos do SMART obedecem às normas e seus respectivos nomes são idênticos para todos os fabricantes de discos rígidos.

Para cada atributo, o SMART fornece basicamente QUATRO valores diferentes com seu significado:

Raw Attribute Value

Dependendo do atributo, mostra valores que podem ser interpretados "como estão", por exemplo: no atributo Power On Time, pode-se interpretar Raw Value como sendo a quantidade de horas que a unidade ficou em funcionamento, desde o dia em que foi ligada pela primeira vez.

Attribute Value

Esses valores representam, numa escala decrescente de 100 até 1, a confiabilidade relativa à cada atributo. O valor considerado normal é 100, sendo que quanto menor o valor, maior a possibilidade de falhas.

Obs.: Alguns fabricantes não obedecem este padrão e colocam os valores normais muito acima de 100, o que tem causado certa confusão na interpretação dos valores em alguns softwares.

Attribute Threshold

Este é o limite mínimo tolerável para que o SMART acuse uma falha iminente na unidade. Cada atributo do SMART tem seu Attribute Threshold padrão, e esses valores são definidos pelos próprios fabricantes com base em testes específicos para cada modelo de disco rígido.

O SMART compara então este valor com o Attribute Value, para definir o quanto a unidade está próxima de uma falha.

Importante: Quanto mais próximo o Attribute Value estiver do Attribute Threshold, maior a possibilidade de que o SMART acuse falha para o atributo.

Worst Value

Este é o valor mais crítico monitorado para cada atributo, ou seja: cada vez que o disco rígido executa algo previsto em algum atributo, é dada uma "nota" para esta ação executada, que entra no cálculo para a formação do Attribute Value.

Enquanto o Attribute Value é um valor médio, o Worst Value pode ser considerado como um valor "aviso" para o atributo.

Isso quer dizer que se o Worst Value apresentar um valor próximo ou mesmo fora do limite do Attribute Threshold, isso não indica necessariamente uma falha, mas apenas um estado momentâneo. Porém, serve como um alerta de que talvez o disco rígido possa ter sido submetido à operação em uma situação fora do limite.

Entendendo o significado dos principais atributos do SMART

Existem dezenas de atributos do SMART, uns mais importantes para avaliação ou detecção de falhas, outros menos importantes. Existem inclusive os atributos colocados exclusivamente por cada fabricante, como mencionado mais acima.

Vamos ver apenas os padrões mais importantes, sendo que os atributos que faltarem são, na maioria das vezes, meramente estatísticos (quantidade de vezes que o disco foi ligado/desligado, por exemplo, entre outros)

Raw Read Error Rate

Representa a taxa de erros de leitura. Pode-se interpretar o valor do campo Raw Attribute Value como sendo a quantidade de erros já apresentadas pela unidade e, obviamente, qualquer valor acima de zero indica que já ocorreu algum erro de leitura.

Atenção no Attribute Value: valores próximos do Attribute Threshold indicam a possibilidade de problemas na superfície gravaável ou falha nas cabeças físicas de leitura/gravação.

Spin Up Time

Representa o tempo médio (em milésimos de segundo) que o motor do disco rígido tem levado para sair de 0 rpm até sua velocidade máxima de rotação. O campo Raw Attribute Value indica a última medição.

Start/Stop Count

Representa a contagem das vezes em que o motor disco rígido foi acionado e parado. Inclui-se aí os eventos: ligar ou desligar o computador, entrar ou sair do modo de espera do Windows, etc. É um valor estatístico, mas o valor do campo Raw Attribute Value pode ser analisado para definir se isso foi ou não uma das causas para outras falhas.

Reallocated Sector Count

Representa a quantidade de setores de reserva (spare sectors) já utilizados para substituir setores defeituosos. Obviamente, quanto maior o valor do campo Raw Attribute Value, pior pode ser considerado o estado da superfície do disco, e naturalmente isso irá influir no Attribute Value, aproximando mais do Attribute Threshold.

Seek Error Rate

Representa a quantidade de erros nos eventos de busca de dados gravados. Cada vez que é ordenado ao disco buscar um dado e ocorre uma falha no posicionamento da cabeça para leitura, o valor para Seek Error Rate aumenta.

Assim como no atributo Raw Read Error Rate, atenção também aqui no Attribute Value: valores próximos do Attribute Threshold indicam a possibilidade de problemas nas cabeças físicas de leitura/gravação.

Power On Hours Count

Este é um valor meramente informativo e o campo Raw Attribute Value mostra a quantidade de horas em que o drive está em funcionamento. Também pode ser encontrado como Power On Time.

Spin Retry Count

Representa quantas vezes o motor do disco rígido já falhou ao tentar sair de 0 rpm até sua velocidade operacional (considerando apenas a 1ª tentativa).

Obviamente, valores acima de zero no campo Raw Attribute Value indicam que o motor já falhou alguma vez e, valores altos indicam que haverá uma falha do motor à qualquer momento, sendo que isso poderá ser observado também no Attribute Value, aproximando-o mais do Attribute Threshold.

Calibration Retry Count

"Calibration" é o posicionamento das cabeças de escrita/leitura na trilha 0. O número representa a quantidade de vezes em que essa operação falhou (considerando apenas a primeira tentativa.

Temperature

Mostra no campo Raw Attribute Value a temperatura atual do disco, em graus Celsius.

Apena s para citar, o Attribute Threshold mostrará aqui a temperatura máxima recomendada pelo fabricante, e o Worst Value mostrará a temperatura na qual o disco já chegou à operar.

O cruzamento desses dados fará decrescer o Attribute Value, ou seja: se o Worst Value tem sido constantemente acima do Attribute Threshold, significa que o disco tem trabalhado constantemente em temperaturas altas.

Write Error Count

Representa a quantidade de erros ocorridos ao gravar dados no disco. Valores acima de 0 indicam que já houve alguma falha nessa operação, e valores mais altos indicam que há algum problema na superfície gravável (possivelmente setores defeituosos) ou nas cabeças físicas de gravação, sendo que isso poderá ser observado também no Attribute Value, aproximando-o mais do Attribute Threshold.

Seja também um cliente preferencial ATA

Contato: ata.info@yahoo.com.br Skype: ata.info@yahoo.com.br