В конце прошлой недели получили проблему с файловым сервером на котором размещались несколько клиентов.
На файловом сервере использовался RAID-5 3ware9650SE-12ML в составе 12 дисков 750GB Western Digital (WD)
12 дисков *
Были начаты восстановительные работы.
Параметры RAID 9650SE
Причина происшествия:
18.05.2012 в процессе работы сервера возникли проблема работы отдельного диска, предположительно плохой контакт либо одиночная ошибка, и получилось так что из массива "выпал" диск номер 6. Данный диск был подхвачен обратно RAID контроллером и последний начал штатную процедуру REBUILD диска для того чтобы "освежить" на нем данные и сделать массив консистентным (consitent). Однако данная процедура не смогла быть завершена в связи с тем что возникли проблемы чтения винчестера номер 3.
18.05.2012 Диск номер 3 стал "сыпаться" показывая множественные отказы чтения и проблемы доступа к данным и служебным областям. Вынести данные не представлялось возможным.
В результате чего мы получили неработоспособный массив в котором отсутствовало 2 диска. Однако диск 6 содержал исправные данные и проблем с работоспособностью не испытывал. Однако не виделся RAID контроллером.
18.05 Было принято решение вернуть массив из состояния OFFLINE в состояние DEGRADED т.к. на диске 6 были валидные данные.
Мы предприняли попытки связаться с поизводителем 3ware (LSI) в США и в России через компании, которые занимаются восстановлением данных.
Были созданы тикеты в системе поддержки пользовалей 3ware, lsi ]]>http://www.2x4.ru/forum/go.php?http://www.lsi.com/support/Pages/submitsupportrequest.aspx]]>
Связаться с ними и обсудить проблему удалось 21.05. Тогда же получили должные прошивки для дисков (DCB) чтобы вернуть массив к нормальному состоянию.
По результатам проведенных работ 21.05 состояние массива было восстановлено до DEGRADED.
Анализ данных SMART дисков приведен ниже. Диски 0 и 8 находятся в плохом состоянии которое ухудшается. Диск 6 имеет несколько незначительных ошибок из за которых пошли основные проблемы.
Переписка с техподдержкой производителя.
В связи с тем что при первоначальной загрузке массива с битым диском был автоматически запуск утилиты проверки диска fsck была потеряна частично структура файловой системы.
Сейчас идет анализ ПО которым можно попытаться вытащить оставшиеся файлы.
]]>http://www.2x4.ru/forum/go.php?http://www.stellarinfo.com/disk-recovery/unix-bsd/bsd-file-recovery.php]]>
]]>http://www.2x4.ru/forum/go.php?http://freesoft.ru/?id=681302]]>
]]>http://www.2x4.ru/forum/go.php?http://rlab.ru/files/Download/logicheskoe_vosstanovlenie_dannyh/UFS_Explorer/]]>
]]>http://www.2x4.ru/forum/go.php?http://www.ufsexplorer.com/rdr_ufs.php]]>
проблема в том что как правило весь этот софт написан под Windows.
хотя UFS используется как правило во FreeBSD только. чем они думали?
Продолжаем анализ.
На заметку. Дампы DCB (disk configuration block) делались при помощи утилиты tw_cdiag.exe
Русская версия Invision Power Board (http://www.invisiоnboаrd.cоm)
© Invision Power Services (http://www.invisiоnpowеr.com)