Технология S.M.A.R.T. ===================================================================== Текст данного пояснения составлен на основе документации к программе SMARTUDM - HDD S.M.A.R.T. Viewer Copyright (C) 1997, Michael Radchenko www.sysinfolab.com/ru и данных ВЕБ-сайта http://yusoft.hotbox.ru/techdoc/storage/smartdoc.htm ===================================================================== Технология S.M.A.R.T. - Self-Monitoring, Analysis and Reporting Technology (от англ. "Технология Самодиагностики, Анализа и Отчета") - была разработана для повышения надежности и сохранности данных на жестких дисках. В большинстве случаев, SMART-совместимые устрой- ства позволяют предсказать появление наиболее вероятных ошибок, тем самым позволяя пользователю сделать резервную копию данных и/или пол- ностью заменить накопитель до выхода его из строя. S.M.A.R.T. представляет собой набор мини-подпрограмм, которые являются частью микрокода накопителя и определяют поддерживаемые диагностические функции. Наиболее распространенные среди них: - набор атрибутов, отражающих состояние отдельных параметров накопителя - внутренние тесты накопителя (self-test) - журналы S.M.A.R.T.(ошибок, общего состояния, дефектных секторов и т.п.) В дальнейшем речь пойдет об атрибутах S.M.A.R.T. - особых характерис- тиках, которые используются при анализе состояния и запаса произво- дительности накопителя. Атрибуты выбираются производителем накопителя, основываясь на способ- ности этих атрибутов предсказывать ухудшение рабочих характеристик нако- пителя или определить его дефектность. Каждый производитель имеет свой характерный набор атрибутов и может свободно вносить изменения в этот набор в соответствиии со своими собственными требованиями и без уведом- ления об этом фирм-продавцов и конечных пользователей. Для считывания S.M.A.R.T.- параметров используется внешний драйвер ( для Win9x - Smartvsd.VXD, находится в %WINDIR%\SYSTEM\IOSUBSYS), при- чем получаемые данные находятся в зависимости от разработчика и версии. Все вышесказанное позволяет сделать вывод об отсутствии на данный мо- мент 100% надежности получаемых данных, но это все же лучше, чем ничего. Каждый атрибут имеет: - идентификационный номер (ID) - текущее значение атрибута в условных единицах (Value или ) - наихудшее значение атрибута за все время эксплуатации (Worst или ) - пороговое значение атрибута (Threshold или ) Пороговые значения устанавливаются в заводских условиях производителем накопителя. Сни- жение значения критически важного атрибута ниже порогового означает скорый выход винчестера из строя. - нормализованное значение атрибута или счетчик (Raw или ). Для каждого атрибута вычисляется по-своему. Например, атрибут Reallocated Sector Count - количество переназначенных секторов в шестнадцатиричном виде. Каждый атрибут может иметь некоторый набор флагов, определяющих его функциональные особенности : - Pre-failure (PF). Если атрибут имеет этот тип, то поле Threshold атрибута содержит минимально допустимое значение атрибута, ниже которого не гарантируется работоспособность накопителя и резко увеличивается вероятность его выхода из строя. - On-line collection (OC). Указывает, что значение данного атрибута обновляется (вычисляется) во время выполнения on-line тестов S.M.A.R.T. или же во время обоих видов тестов (on-line/off-line). В противном случае, значение атрибута обновляется только при выполнении off-line тестов. - Performance related (PR). Указывает на то, что значение этого атрибута напрямую зависит от производительности накопителя по отдельным показателям (seek/throughput/etc. performance). Обычно обновляется после выполнения self-test`ов SMART. - Error rate (ER). Указывает на то, что значение атрибута отражает относительную частоту ошибок по данному параметру (raw read/write, seek, etc.). - Events count (EC). Указывает на то, что атрибут является счетчиком событий. - Self-preserve (SP). Указывает на то, что значение атрибута обнов- ляется и сохраняется автоматически (обычно при каждом старте нако- пителя и при выполнении тестов SMART). В программе Sklad_2.exe для расшифровки ID атрибутов используются данные из файла BASE\smart. Вы можете самостоятельно править нахо- дящиеся в нем данные. Описание некоторых атрибутов приведено ниже. ===================================================================== Описание атрибутов ===================================================================== Все права на данное описание принадлежат Михаилу Маврицину (hwdiver@nightmail.ru). Полную версию данного документа можно по- лучить на www.pcjs.chat.ru. [1] Raw Read Error Rate Частота появления ошибок при чтении данных с диска. Данный пара- метр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине аппаратной части накопителя. В нормальной ситуации должно совпадать с [195] параметром. [2] Throughput Performance Средняя производительность (пропускная способность) диска. Уменьшение значения value этого атрибута с большой вероятностью указывает на проблемы в накопителе. [3] Spin Up Time Время раскрутки шпинделя. Среднее время раскрутки шпинделя диска от 0 RPM до рабочей скорости. Предположительно, в поле raw value содержится время в миллисекундах/секундах. [4] Start/Stop Count Количество циклов запуск/останов шпинделя. Поле raw value хранит общее количество включений/выключений диска. [5] Reallocated Sectors Count Количество переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи/верификации он пытается переместить данные из него в специальную резервную область (spare area) и, в случае ус- пеха, помечает сектор как "переназначенный". Также, этот процесс называют remapping, а переназначенный сектор - remap. Благодаря этой возможности, на современных жестких дисках очень редко видны [при тестировании поверхности] так называемые bad block. Однако, при большом количестве ремапов, на графике чтения с поверхности будут заметны "провалы" - резкое падение скорости чтения (до 10% и более). Поле raw value содержит общее количество переназначенных секторов. [6] Read Channel Margin Запас канала чтения. Назначение этого атрибута не документировано и в современных накопителях не используется. [7] Seek Error Rate Частота появления ошибок позиционирования БМГ. В случае сбоя в ме- ханической системе позиционирования, повреждения сервометок (servo), сильного термического расширения дисков и т.п. возникают ошибки позиционирования. Чем их больше, тем хуже механики и/или поверхности жесткого диска. [8] Seek Time Performance Средняя производительность операций позиционирования БМГ. Данный параметр показывает среднюю скорость позиционирования привода БМГ на указанный сектор. Снижение значения этого атрибута говорит о неполадках в механике привода. [9] Power-On Hours Количество отработанных часов во включенном состоянии. Поле raw value этого атрибута показывает количество часов (минут, секунд - в зависимости от производителя), отработанных жестким диском. Сни- жение значения (value) атрибута до критического уровня (threshold) указывает на выработку диском ресурса (MTBF - Mean Time Between Failures). На практике, даже падение этого атрибута до нулевого значения не всегда указывает на реальное исчерпывание ресурса и накопитель может продолжать нормально функционировать. [10] Spin Retry Count Количество повторов попыток старта шпинделя диска. Данный атрибут фиксирует общее количество попыток раскрутки шпинделя и его выхо- да на рабочую скорость, при условии, что первая попытка была неу- дачной. Снижение значения этого атрибута говорит о неполадках в механике привода. [11] Recalibration Retries Количество повторов попыток рекалибровки накопителя. Данный атри- бут фиксирует общее количество попыток сброса состояния накопите- ля и установки головок на нулевую дорожку, при условии, что пер- вая попытка была неудачной. Снижение значения этого атрибута гово- рит о неполадках в механике привода. [12] Device Power Cycle Count Количество полных циклов запуска/останова жесткого диска. [13] Soft Read Error Rate Частота появления "программных" ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине программного обеспечения, а не аппаратной части накопителя. [191] Emergency Re-track (?) [192] ECC On-The-Fly Count (?) [193] Load/Unload Cycle Count Количество циклов вывода БМГ в специальную парковочную зону/в ра- бочее положение. Подробнее - см. описание технологии Head Load/Unload Technology. [194] Drive Temperature Температура. Данный параметр отражает в поле raw value показание встроенного температурного сенсора в градусах Цельсия. [195] Hardware ECC Recovered Количество аппаратно исправленых (ECC) ошибок. В нормальной ситуа- ции должно быть равно значению параметра [1]. [196] Reallocation Event Count Количество операций переназначения (ремаппинга). Поле raw value этого атрибута показывает общее количество попыток переназначения сбойных секторов в резервную область, предпринятых накопителем. При этом, учитываются как успешные, так и неудачные операции. [197] Current Pending Sector Count Текущее количество нестабильных секторов. Поле raw value этого ат- рибута показывает общее количество секторов, которые накопитель в данный момент считает претендентами на переназначение в резервную область (remap). Если в дальнейшем какой-то из этих секторов бу- дет прочитан успешно, то он исключается из списка претендентов. Если же чтение сектора будет сопровождаться ошибками, то накопи- тель попытается восстановить данные и перенести их в резервную об- ласть, а сам сектор пометить как переназначенный (remapped). Пос- тоянно ненулевое значение raw value этого атрибута говорит о низ- ком качестве (отдельной зоны) поверхности диска. [198] Uncorrectable Sector Count Количество нескорректированных ошибок. Атрибут показывает общее количество ошибок, возникших при чтении/записи сектора и которые не удалось скорректировать. Рост значения в поле raw value этого атрибута указывает на явные дефекты поверхности и/или проблемы в работе механики накопителя. [199] UltraDMA CRC Error Count Общее количество ошибок CRC в режиме UltraDMA. Поле raw value со- держит количество ошибок, возникших в режиме передачи данных UltraDMA в контрольной сумме (ICRC - Interface CRC). Примечание автора. Практика, собранная статистика и изучение журналов ошибок SMART показывают: в большинстве случаев ошибки CRC возникают при сильном завышении частоты PCI (больше номинальных 33.6 MHz), сильно перекрученом кабеле, а также - по вине драйверов ОС, кото- рые не соблюдают требований к передачи/приему данных в режимах UltraDMA. [200] Write Error Rate (Multi Zone Error Rate) Частота появления ошибок при записи данных. Показывает общее коли- чество ошибок, обнаруженных во время записи сектора. Чем больше значение в поле raw value (и ниже значение value), тем хуже сос- тояние поверхности диска и/или механики привода. [202] TA Counter Increased (Torque Amplification Count) Количество усилий вращающего момента привода. [220] Disk Shift Сдвиг пакета дисков относительно оси шпинделя. Актуальное значе- ние атрибута содержится в поле raw value. Единицы измерения - не известны. Подробности - см. в описании технологии G-Force Protection. Примечание. Сдвиг пакета дисков возможен в результате сильной ударной нагрузки на накопитель в результате его падения или по иным причинам. [221] G-Sense Error Rate Частота появления ошибок в результате ударных нагрузок. Данный ат- рибут хранит показания ударочувствительного сенсора - общее коли- чество ошибок, возникших в результате полученных накопителем внеш- них ударных нагрузок (при падении, неправильной установки, и т.п.). Подробнее - см. описание технологии G-Force Protection. [222] Loaded Hours Нагрузка на привод БМГ, вызванная общей наработкой часов накопите- лем. Учитывается только период, в течении которого головки находи- лись в рабочем положении. [223] Load/Unload Retry Count Нагрузка на привод БМГ, вызванная многочисленными повторениями операций чтения, записи, позиционирования головок и т.п. Учиты- вается только период, в течении которого головки находились в ра- бочем положении. [224] Load Friction Нагрузка на привод БМГ, вызванная трением в механических частях накопителя. Учитывается только период, в течении которого головки находились в рабочем положении. [225] Load/Unload Cycle Count Общее количество циклов нагрузки на привод БМГ. Учитывается только период, в течении которого головки находились в рабочем положении. [226] Load-in Time Общее время нагрузки на привод БМГ. Предположительно, данный атри- бут показывает общее время работы накопителя под нагрузкой, при условии, что головки находятся в рабочем состоянии (вне парковоч- ной зоны). [227] Torque Amplification Count Количество усилий вращающего момента привода. [228] Power-Off Retract Count Количество зафиксированных повторов в(ы)ключения питания накопите- ля. [230] GMR Head Amplitude Амплитуда дрожания ГМР-головок (GMR-Head) в рабочем состоянии. [231] Head Flying Hours [250] Read Error Retry Rate ===================================================================== Поддержка ===================================================================== Все вопросы, пожелания, замечания, а так же сообщения об обнару- женных ошибках направляйте по адресу: checkcfg@narod.ru, Татукову Андрею. Сайт программы - http://checkcfg.narod.ru. [END]