SMART без мистики: какие показатели реально говорят о здоровье HDD/SSD в 2025

17 сентября 2025 2 мин чтения
Матовый 3D-рендер HDD и NVMe рядом с панелью SMART со шкалами «перераспределённые», «ожидающие», «неисправимые», «CRC-интерфейса», «износ, %», «температура», «часы работы» на тёмном фоне

Я половину жизни ковыряюсь в накопителях — от древних IDE-жёстких до современных NVMe. За эти годы я видел тысячи «умирающих» дисков и ещё больше ложных тревог. Ниже — сжатое, практическое руководство: какие SMART-показатели действительно важны в 2025 году, какие значения считать тревожными и когда пора планировать замену. Без эзотерики, только то, что подтверждается реальной практикой.

Что такое SMART и как им пользоваться без самообмана

SMART — это набор счётчиков и флагов, которые накопитель ведёт сам. У каждого вендора — свои шкалы и названия, поэтому смотрим в первую очередь на RAW-значение (сырое число), а не на «нормализованное» (100/200/253 и пороги). Нормализованные шкалы нужны прошивке диска, но часто мешают человеку.

Мини-набор инструментов:

  • Windows: CrystalDiskInfo, smartmontools (Windows build).
  • Linux/macOS: smartctl из пакета smartmontools.
  • NVMe: smartctl -a /dev/nvme0 или nvme smart-log /dev/nvme0.

Главное правило интерпретации: динамика важнее абсолютного нуля. Один перераспределённый сектор, который годами не растёт, — это нормально. Те же «+5 секторов каждую неделю» — уже причина действовать.

HDD: ключевые SMART-атрибуты, которые решают судьбу диска

Крупный HDD на тёмно-синем фоне и прозрачная панель с ключевыми атрибутами SMART: «перераспределённые», «ожидающие», «неисправимые», «CRC-интерфейса», «температура, °C».

Reallocated Sector Count (ID 05)

  • О чём говорит: количество секторов, которые диск пометил плохими и перенёс в резерв.
  • Когда тревожно: если значение > 0 и растёт. Разовая единица без роста — наблюдаем. Ускорение роста — планируем замену.
  • Что делать: полная проверка поверхности (long/extended SMART test), контроль бэкапов, мониторинг раз в 1–2 дня.

Current Pending Sector (ID C5)

  • О чём говорит: сомнительные (нестабильные) сектора, которые диск пока не смог прочитать.
  • Когда тревожно: любое ненулевое значение. Даже C5=1 — уже риск.
  • Что делать: принудительное перечитывание поверхности или нулевание только проблемных LBA, затем смотрим: C5 должен уйти либо в 0 (хороший сценарий), либо перерасти в Reallocated (05). Если C5 болтается неделями — замена.

Uncorrectable Sector Count (ID C6)

  • О чём говорит: количество необрабатываемых ошибок чтения.
  • Когда тревожно: всегда, если > 0. Часто растёт вместе с C5.
  • Что делать: немедленный бэкап важных данных, диагностика кабеля/питания, тест поверхности. При росте — диск под замену.

UDMA CRC Error Count (ID C7)

  • О чём говорит: ошибки по интерфейсу (SATA-кабель, разъём, электропомехи).
  • Когда тревожно: когда счётчик продолжает расти. Большое число, которое не меняется месяцами, — обычно след старой проблемы.
  • Что делать: заменить SATA-кабель, переставить штекеры, проверить питание, вести журнал значений. Рост остановился — живём дальше.

Power-On Hours (ID 09), Start/Stop Count (ID 04), Load/Unload Cycle Count (ID C1)

  • О чём говорят: наработка по времени и циклы парковки/старта.
  • Когда тревожно: очень высокий C1 (сотни тысяч) у ноутбучных HDD — ускоренный износ механики. Частые старты/остановки (04) тоже сокращают ресурс.
  • Что делать: настроить питание так, чтобы диск не «кликал» каждые 5 минут, вывести служебные задачи на одно «ночное окно».

Температура (ID 194/190)

  • О чём говорит: рабочая температура.
  • Когда тревожно: длительная работа выше 50–55 °C; пики >60 °C — плохо. Для холодных складов проблемна и постоянная низкая температура <10–15 °C (конденсат после прогрева).
  • Что делать: обдув, отвод вибраций, разнести диски, убрать кабели с «горячих точек».

Сводная памятка по HDD

ПоказательЧто этоТревожноДействия
05 ReallocatedПеренесённые сектораРост во времениБэкап, extended-тест, план замены
C5 PendingПодозрительные сектораЛюбое >0Перечитать/перезаписать, смотреть переход в 05
C6 UncorrectableНевосстановимые ошибкиЛюбое >0Срочный бэкап, диагностика, чаще — замена
C7 UDMA CRCОшибки по кабелюРостСменить SATA-кабель/порт, наблюдать
09, 04, C1Часы/старты/парковкиОчень высокий C1; частые 04Настройка питания, уменьшить парковки
194/190 TempТемпература>50–55 °C постоянноОхлаждение, виброразвязка

SSD (SATA/NVMe): на что смотреть в 2025

Матовый 3D-рендер NVMe и 2.5″ SSD с панелью SMART, подчёркивающей износ, объём записей, ошибки целостности, температуру и паспортный TBW.

У твердотельных накопителей нет «плохих секторов» в привычном смысле, зато есть износ ячеек и механизмы выравнивания записей. Ключ — оценка износа и объёма реальных записей.

Percentage Used (NVMe) / Percent Lifetime Used / Media Wearout Indicator (SATA-SSD)

  • О чём говорит: оценка использованного ресурса TBW/износа. NVMe обычно показывает 0–100%, где 100% — паспортный ресурс исчерпан.
  • Когда тревожно: ≥ 80–90% — пора планировать замену; 100% — менять по возможности заранее (многие ещё живут, но риски растут).
  • Что делать: вывести крупные записи на другой диск, держать свежий бэкап, заказать замену.

Host Writes / NAND Writes (часто ID 241/242/246 у SATA-SSD)

  • О чём говорит: сколько реально записали на накопитель (в гигабайтах/терабайтах).
  • Зачем нужно: сверяем с паспортным TBW модели. Если близко к TBW — не «ждём чуда».

Program/Erase Fail Count, Uncorrectable, Media/Integrity Errors

  • О чём говорят: сбои программирования/стирания страниц и ошибки целостности.
  • Когда тревожно: любой рост этих счётчиков, особенно на молодых SSD. В паре с ростом Percentage Used — фактор замены.

Температура SSD

  • Нормально: 30–60 °C под нагрузкой. NVMe-контроллеры без радиатора легко уходят за 70 °C и троттлят.
  • Что делать: радиатор/термопрокладка, обдув, не прятать под видеокарту.

Сводная памятка по SSD

ПоказательЧто этоТревожноДействия
Percentage/Percent UsedПроцент износа≥80–90%План замены, бэкап
Host/NAND WritesРеально записаноБлизко к TBWПеренос нагрузок, заказ нового
Media/Integrity ErrorsОшибки целостностиЛюбой ростДиагностика, часто — замена
ТемператураНагрев контроллера/чипов>70 °C и троттлингРадиатор, обдув

Вибрации, монтаж и «невидимые убийцы»

Для HDD крошечные постоянные вибрации опаснее кратковременного пика. Диски в стойках должны стоять на корзинах с демпферами, в NAS — без резонансных «мостиков». Признак проблемы — низкая скорость в линейном чтении при чистом SMART и «микроподвисания». Решение: переставить корзину, поменять корпусные вентиляторы на более тихие (меньше биения), проверить фиксацию кабелей.

Как читать пороги и не путаться в шкалах

  • Порог SMART (THRESH) — не «красная черта для человека», а внутренний критерий прошивки, при котором диск меняет статус на FAIL. Ждать FAIL — плохая стратегия.
  • Нормализованные значения (VALUE/WORST) — у каждого производителя своя математика. Мы ориентируемся на RAW и динамику.
  • Контролируем контекст: «было 0 → стало 1 после внезапного отключения света» — это не то же самое, что «1 → 5 → 17 за неделю без аварий».

Блиц-проверка за 60 секунд

  1. Температура сейчас и под нагрузкой (HDD < 50–55 °C; NVMe желательно < 70 °C).
  2. C5/C6 — строго нули? Если нет — сразу в план действий.
  3. C7 растёт? Меняем кабель/порт.
  4. Процент износа у SSD — не приближается к 100%?
  5. Host Writes vs паспортный TBW — есть запас?
  6. Замечаем тренд: делаем скрин/лог сегодня, сверяем через неделю.

Периодичность проверок и автоматизация

  • Домашний ПК/ноутбук: раз в месяц быстрая проверка + раз в квартал — полный SMART-тест (long/extended).
  • NAS/сервер: мониторинг 24/7, алерты по C5/C6/C7, температуре и Percentage Used. Раз в 6–12 месяцев — регламентная замена самых старых HDD из массива, чтобы не «синхронно посыпались».
  • Держите журнал значений: дата, 05/ C5/ C6/ C7/ температура/ процент износа. Это спасает от субъективности.

Когда пора менять накопитель

  • HDD: растущие C5/C6, лавинообразный рост 05, сочетание ошибок поверхности и частых таймаутов в логах ОС, температура не держится в норме даже после обслуживания.
  • SSD: Percentage Used ≥ 90% и/или рост «media/integrity errors», внезапные падения скорости/заморозки под записью, пропадания из BIOS.
  • Инфраструктурные причины: важный рабочий диск достиг возрастного порога (например, 5–6 лет ежедневной работы у HDD в NAS) — меняем профилактически, не дожидаясь сюрпризов.

Резервные копии: схема 3-2-1, которая пережила десятилетия

SMART — это про диагностику, а данные спасают бэкапы. Придерживайтесь правила 3-2-1:

  • 3 копии данных,
  • 2 разных типа носителей (например, диск в ПК + внешний HDD/NAS),
  • 1 копия вне площадки (облако/другая квартира/офис).

Плюс — регулярная проверка восстановления (test-restore). Архив, который «никогда не проверяли», равен отсутствующему.

Мини-FAQ

Почему у меня один перераспределённый сектор и всё зелёное?
Потому что важна динамика. Одна «шраминка» без роста — это опыт, а не катастрофа.

CrystalDiskInfo пишет «Внимание» из-за C7, но диск быстрый. Это плохо?
Если C7 не растёт — нет. Поменяйте кабель для спокойствия и продолжайте мониторить.

NVMe показывает 100% ресурса, но диск живёт. Можно работать?
Критических задач — лучше не. Сделайте бэкап и планируйте замену: дальше вы идёте «на честном слове контроллера».

Можно ли «вылечить» Pending-сектора без потери данных?
Иногда помогает перечитывание/копирование с повторными попытками. Но это игра с огнём: сначала бэкап, потом эксперименты.

Температура 55 °C у HDD — это конец?
Нет, но так жить постоянно не стоит. Снизьте до 40–45 °C обдувом и правильной укладкой кабелей.


Если перестать ждать мифических «красных лампочек» и смотреть на реальные счётчики и их поведение, SMART превращается из загадки в обычный инструмент планового обслуживания. Он не предсказывает будущее, но даёт достаточно ранних маркеров, чтобы уйти от потерь.