Причины выхода RAID массивов из строя

  • Причины выхода RAID массивов из строя

К самым распространенным причинам выхода RAID массивов из строя является недостаточное внимание системных администраторов к работе накопителей, а именно их уверенность в том, что после ремонта поломка не повторится снова. Конечно, массив не перестанет функционировать, если, к примеру, в RAID 5 станет неисправным один из дисков, при этом лишь уменьшится общая скорость работы устройства. Незначительная неполадка в работе массива не повод для принятия системным администратором активных действий по устранению проблемы, так как массив может проработать в таком «облегченном» режиме еще некоторое время. Расчет на «некоторое время» и отсрочка требующегося ремонта - это самые распространенные причины выхода RAID массивов из строя.

Причины выхода RAID массивов из строя: что делать в первую очередь?

При поломке какого-то из дисков массива, следует незамедлительно копировать важные данные и, заменив накопитель, сделать ребилд устройства.

Предварительный бэкап необходим всегда, потому устройство может «зависнуть» в процессе ребилда массива, например, если на одном диске во время чтения или записи присутствует бэд-блок. Контроллер оказывается не в состоянии считать информацию с нужных секторов. Как итог, возможна перегрузка сервера и полное «разрушение» всего массива. Зависание в такой ситуации связывают с некорректной обработкой данных. Описанное характерно для устройств, которые укомплектованы дешевыми и ненадежными моделями контроллеров, но такое возможно и при использовании качественных и дорогих комплектующих.

Причины выхода RAID массивов из строя могут быть заключены в одновременном отключении нескольких дисков. Такое «массовое» отключение может случиться при накоплении бэд-блоков или проблем со SMART. Если количество бэд-блоков не превышает допустимое, то устройство работает корректно, но, тем не менее, массив может выйти из строя в самый неожиданный момент. На первый взгляд проблемы нет, но почему-то диск запускается с соответствующим звуком старта, контроллер определяется верно, но диск в итоге имеет статус «offline», массив отказывается полноценно работать и не предоставляет информацию. Все потому, что контроллер не может обнаружить данные либо определяет диск как нерабочий.

Существует огромное количество примеров неполадок в работе, в результате которых массивы выходят из строя. Но восстанавливать потерянную информацию необходимо.

30.01.2018 13:52:24
0
875
Мы выполняем

Комментарии:

Внимание: HTML символы запрещены!
Captcha
я принимаю условия договора публичной оферты и даю согласие на обработку персональных данных