![]() |
Intel Modular mfsys25 замена дисков в RAID
Доброго всем коллеги!
Вопрос по проблемке с RAID в серваке Intel Modular mfsys25. На нем собрано парочка LUN из 10 дисков (Все в RAID 10). На серваке крутятся несколько виртуальных машин. Все это на XenServer. Полторы недели назад в корзине с дисками на 10-ом диске загорелся индикатор. Посмотрел в веб морде, диск=DEAD. Так же заметил, что диск в корзине под №1 в Event-ах сервера зарегистрировалось уже несколько событий по найденным bad sector на диске №1. Стал в спешном режиме искать диски на замену этим. Купил как раз два. Сегодня поменял диск №10. Запустился Rebuild LUNа. Сейчас пришел домой решил посмотреть что с процессом ребилда. Смотрю в 20:20 - Predictive Data Migration has completed. Т.е. миграция данных завершилась успешно! Но отвалился диск под №1 у которого системой были замечены bad sector. И я не понимаю немного - диск не пометился как dead. Статус у него=Stale. А в событиях есть такие по поводу этого диска: 1) Bad sector has been found on physical disk 2) A drive has encountered PFA condition (через пару минут) 3) Physical Drive has become stale (через секунду после второго события) Если кликнуть на этот диск в веб морде сервака, то у него в меню есть такой пункт "Clear State Condition". Вот я не понимаю суть события A drive has encountered PFA condition (что такое PFA) и Physical Drive has become stale (stale=устарел, в смысле он устарел). И как считаете диск №1 тоже сдох или впал какое непонятное состояние? Но данные на RAIDе живые, виртуалки работают. Я не пойму, это как-то связано с заменой 10-го диска или так совпало, что только завершился ребилд 10-го диска после замены и тут же сдох №1? Спасибо! |
Цитата:
Цитата:
Цитата:
|
Ну т.е. так совпало, что диск №1 выпал из RAID?
Пгуглив я ни не понял пока про состояние Stale! Как его понимать? Stale вроде переводится как устаревший. Т.е. диск не сдох, но впал в какую-то кому! Про PFA немного понятнее - это вроде как отказ диска по SMARTу. Тут уже логичнее, то что у него были события bad sector..... Т.е. мне надо и этот диск (№1) менять? |
Цитата:
|
По поводу нашей конфигурации дисков. Я сейчас стянул картинку с этого сервака в виде графических связей. Ну и на схеме видно, что диск #1 отвалился и висит в состоянии Unused
![]() В сервере 10 дисков по 600ГБ. каждый. Из этого всего сделан, как я понимаю пул "Cloud" и там уже нарезаны LUNы в 10-ке RAID. Вроде так понял конфу? Спасибо за инфу по статусам - я ее видел. Но мне просто не понятна сама суть Stale. Устарели данные. Это что на диск не зеркалировалась инфа в нужный момент из-за сбоев с ним? |
Цитата:
|
Цитата:
Мне так же как и сегодня его на живую вытащить из сервака и на его место установить новый? Не надо же вроде перед извлечением диска с таким статусом на серваке, какие-то действия подготовительные делать? Сегодня когда я менял диск №10 со статусом Dead, я так и сделал: 1) вытащил сдохший диск 2) поставил на его место новый 3) В веб морде нажал hot spare..(как-то так) 4) Сервак спросил, что я хочу сделать новый пул или добавить к Cloud (который уже есть). Я добавил к Cloud. 5) Начался ребилд массива А если диск в состоянии Stale наверное алгоритм не меняется? Данные с него ведь наверняка на каком-то из дисков отзеркалированны? Спасибо! |
Цитата:
Цитата:
|
Цитата:
|
Цитата:
|
Цитата:
Цитата:
Вижу уже, что не про вас — но мне ваш уровень сразу не виден, так что я на всякий случай. :) |
Ну я сам в такой железке первый раз что-то меняю и некоторые кнопки в интерфейсе немного сбивают с толку. Что нажать и что будет. А встроенная справка по какой-то причине не отображается. Какой-то косяк софта.
Я раньше в основном имел дело с более простыми железками с RAIDами, поэтому перед любым действием хочется сначала полностью понять что надо и что будет если так сделать..... Сейчас был в серверной. На диске №1? который "вылетел" из массива после ребилда диска №10, горит красный индикатор, как и ожидалось. Я думаю хоть статус DEAD хоть STALE, надо менять диск на новый по схеме, что делал в пятницу вечером с диском 10. |
Время: 22:56. |
Время: 22:56.
© OSzone.net 2001-