HP Proliant DL120 с RAID-контроллером p212i. Не загружается

Хотел пользу принести родному предприятию - вышел в субботу на работу. Стал выполнять профилактические работы с сервером HP Proliant DL120G6 и словил незагрузку. Стабильную такую. Ранее уже сталкивались и думали, что решили уже вопрос (оно не проявлялось).

Вся история целиком:

 

Был куплен сервер от HP в сборе.
Но пришло время увеличить объем дисков. Диски заказаны, установлены, система мигрирована. Всё вроде хорошо, но однажды в понедельник он оказался выключен. После пропажи питания он не загрузился. То загружался, то нет. При попытке загрузки останавливался после инициализации RAID-контроллера и пищал сигналы (к сожалению найти, о чем сигналы не удалось).

 

С техподдержкой HP общались-общались и настройки сбрасывали и диагностику проводили и отчёты отсылали. Помогало ненадолго. Повторное общение с техподдержкой HP привело к замене одного из дисков (они сами предложили).

 

А в этот раз всё проявилось и стало хуже. Он не загружался с вероятностью 95%. Короче хуже не может быть. Пришёл к выводу, что дело в RAID-контроллере. Поскольку когда рейд-массив не создан, то сервер пытается загрузиться.

 

В очередную попытку настройки он загружает ОС и я обновляю прошивку RAID-контроллера через Windows. Фуух! Стабильная загрузка! Версия была 3.00, стала 6.40.

 

Есть возможность загрузки обновления без ОС, с помощью стартового диска (там есть Maintenance режим). Но я не успел им воспользоваться, поскольку ОС загрузилась:)

Процититрую запись из блога Алексея Максимова:

 

Если вы работаете с серверным оборудованием HP на платформе Windows, то в основной своей массе обновление микропрограммного обеспечения (firmware) той или иной железяки от HP не представляет особых сложностей, так как почти всегда на сайте техподдержки HP доступны последние версии утилит Online-обновления под Windows. Задача может несколько усложнится если возникает потребность прошить какую-то уже морально устаревшую железку. HP предоставляет универсальный загрузочный диск который содержит в себе большую коллекцию прошивок для Offline-обновления. Ранее этот диск назывался Firmware Maintenance CD и умещался на стандартный накопитель CD, но спустя какое-то время, перерос формат CD и трансформировался в современный HP Smart Update Firmware DVD. Не смотря на постоянный рост, из состава этого диска периодически убираются последние доступные версии прошивок для оборудования которое со временем морально устаревает. В этом можно убедиться, если почитать историю изменения состава диска от версии к версии.

Рассмотрим процесс обновления прошивки железяки, уже ставшей на сегодня раритетом – RAID контроллера HP Smart Array 6400. Потребность обновления прошивки для этого контроллера диктуется статусным предупреждением которое выдаёт утилита HP Array Configuration Utility, говорящее о потенциальных проблемах при использовании массивов RAID 1 и RAID 1+0

Как мы видим, в статусном сообщении в данном случае есть ссылка на документ c01587778 в котором описаны проблемы исправляемые новой версией прошивки. Воспользовавшись поиском, открываем этот документ на сайте HP - Document ID: c01587778 – FIRMWARE UPGRADE REQUIRED to Prevent Rare Potential Data Write Errors on a RAID 1 or RAID 1+0 Volume Configured on an HP Smart Array SAS/SATA or SCSI Controller in Scenario of Concurrent Background Surface Analysis and I/O Write Operations

В документе находим информацию о том, что для исправления описанных проблем для нашего контроллера требуется прошивка версии не ниже 2.84

Для того чтобы скачать последнюю свежую версию прошивки для нашего контроллера, переходим на сайт техподдержки HP – в раздел сайта Support & Drivers и выполняем поиск по названию модели, в нашем случае "HP Smart Array 6400". Как мы видим, нужная нам версия прошивки не доступна для платформы Windows.

Наряду с этим, в текущую версию диска HP Smart Update Firmware DVD 9.30 прошивка для данного контроллера также не включена. Поэтому нашей задачей будет скачать доступное обновление для Linux и интегрировать его в загрузочный диск HP Smart Update Firmware DVD.

Для этого нам потребуется:

  • Само обновление прошивки – Online ROM Flash Component for Linux 2.84 (A), а конкретней два файла из архива обновления – CP009355.scexe и CP009355.md5
  • Образ загрузочного диска Smart Update Firmware DVD ISO 9.30 (FW930.2011_0503.59.iso)
  • Утилита HP USB Key Utility for Windows 1.6.0.0 (cp014214.exe)

Последнюю версию загрузочного образа и утилиты можно загрузить по ссылке: HP Insight Foundation > Downloads

С помощью утилиты мы запишем образ диска на USB-накопитель, сделав его загрузочными, после чего на этот же накопитель скопируем файлы обновления нашего контроллера.

Для того чтобы установить утилиту в Windows 7 в свойствах инсталлятора включим режим совместимости с Windows Vista (SP2)

После установки сама утилита (hpusbkey.exe) у меня корректно заработала также только в режиме совместимости Windows Vista (SP2) и только в режиме запуска с повышенными административными привилегиями.

При запуске утилиты выбираем создание загрузочного USB-накопителя, понимая то что все данные на накопителе будут утеряны в процессе форматирования.

На следующем шаге определяем образ диска который будет перенесён на накопитель

Далее нас предупредят что все данные на USB накопителе будут утеряны и будет выполнена подготовка накопителя. После того как утилита закончит свою работу, посмотрим что у нас появилось на накопителе..

Скопируем ранее распакованные файлы обновления прошивки контроллера

CP009355.scexe

CP009355.md5

в подкаталог \HPFWUP930\hp\swpackages\

Если в качестве образа используется старая версия Firmware Maintenance CD то файлы нужно скопировать в подкаталог \compaq\swpackages\

После этого в BIOS сервера меняем порядок опроса загружаемых устройств и загружаем сервер с получившегося USB-накопителя.

В меню загрузки HP Smart Update Firmware Boot Menu обязательно выбираем интерактивный режим установки обновлений – Interactive Firmware Update

Далее, на стартовом экране установщика, переходим на закладку Firmware и кликаем по гиперссылке Install Firmware

После этого в память сервера будет подгружен HP Smart Update Manager который покажет имеющиеся у него преднастроенные пакеты обновлений. Так как в ручную добавленное нами обновление относится к категории Non-Bundle product, то есть не входит не в один их преднастроенных пакетов, обязательно нужно будет отметить опции ALLOW NON-BUNDLE PRODUCTS и ALLOW NON-BUNDLE VERSIONS

Далее HP Smart Update Manager выполнит проверку необходимости установки указанных категорий обновлений и выведет список требуемых обновлений, в котором мы и должны будем отметить интересующее нас обновление прошивки нашего контроллера

Дождавшись окончания процесса offline-установки обновлений можно просмотреть лог установки.

После перезагрузки сервера убеждаемся в том что отображается обновлённая версия прошивки и исчезло статусное предупреждение утилиты HP Array Configuration Utility.

Столкнулся на практике с неприятной ситуацией когда дисковая полка HP MSA50 подключенная к серверу виртуализации HP ProLiant DL360 через RAID контроллер HP Smart Array P800 была аварийно обесточена. На дисковой полке был сделан один логический диск RAID 1+0 из 10 физических дисков, который после повторной подачи питания на полку по понятной причине стал недоступен операционной системе хоста. В процессе перезагрузки сервера появилось безрадостное сообщение о том что логический диск отключён контроллером во избежание потери данных:

Несмотря на то, что в DPM имелась копия виртуальных машин расположенных на отвалившемся томе, стало как то не по себе. Немного пошебуршав на форуме тех.поддержки HP нашёл пару веток обсуждения похожей ситуации (например HP Community – ML 350 G3 "Logical drives disabled due to possible data loss"). Выбор нажатия "F2" при первой загрузке в моём случае исправил ситуацию – логический диск был активирован.

Благодаря тому что на Smart Array контроллере была установлена кэш-память с исправным на этот момент батарейным модулем, как я понял, данные находящиеся в кэше контроллера на момент падения полки после включения логического диска были успешно дописаны на этот диск, о чем посвидетельствовало статусное сообщение утилиты HP Array Configuration Utility

В ОС том с полки поднялся как ни в чём не бывало и виртуальные машины успешно стартовали. Вздохнув с облегчением, я ещё раз для себя подчеркнул важность наличия валидных резервных копий виртуальных машин, и что на мой взгляд главное в описанной ситуации, – наличие на RAID контроллере кэш-памяти с исправным батарейным модулем.

Если вы используете в работе приложение HP Version Control Agent (VCA) для поддержания в актуальном состоянии драйверов и прошивок оборудования HP, то возможно столкнулись ситуацией когда VCA отображает информацию о том, что на ваш сервер якобы требуется обновление пакета HP ProLiant Smart Array P700m Clustering Support Software for Windows, несмотря на то что вы не имеете данной железки в составе этого сервера.

При открытии ссылки на информацию о соответствующем пакете можно видеть имя файла отвечающего за этот пакет.

Судя по информации найденной на форуме HP Communities параметры инсталляционного пакета HP ProLiant Smart Array P700m Clustering Support Software for Windows конфликтуют с параметрами пакета HP ProLiant PCI-express Power Management Update for Windows. Для решения этой проблемы предлагается из каталога репозитория VCRM удалить оригинальный файл cp012775.exe, а для того чтобы модуль обновления не пытался его закачать заново создать пустой файл с таким же именем.

После того как это сделано, в веб-консоли VCRM переходим в каталог и запускаем его сканирование и перестройку (закладка Catalog > rescan repository & rebuild catalog) и дожидаемся когда в логе VCRM появится запись о завершении операции – "Catalog validation completed."

После этого, для того чтобы удостовериться в том, что после очередного обновления проблема не появится снова, запускаем форсированное обновление каталога (закладка Catalog > update from hp.com now) и дожидаемся когда в логе появиться запись о завершении операции – "The automatic repository update process completed successfully. No new, applicable files were found for download."

Оставить комментарий

Комментарии: 0