![]() |
Проблемы с SAS контроллером или с жестким?
Доброе утро уважаемые форумчане,
Надеюсь на ваши мудрые советы.. Дело в том что имеется сервер HP ML 150 G5 в нем два жестких SATA 500 Gb Seagate, SAS контроллер SAS1064E, RAID 1 стоит. Все работало прекрасно более двух лет. Проблема началась недели две назад после установки Acronis Console, для удаленного резервного копирования. На утро пришел NTLDR is Missing перегружаю, нажимаю три волшебных клавиши, пошла перезагрузка. Сервер отказывается видеть RAID controller как будто его там и нет. Выключаю сервер, включаю, контроллер увидел но РЕЙД в состоянии degraded и пошел ребилд дисков. Снес этот Акронис консоль к черту. Ребилд через часов 12-15 завершился, все диски работают нормально зелененькие довольные огоньки мигают. Прихожу через пару дней опять NTLDR is missing. Ситуация один в один…Смотрю логи…Перезагрузка системы начинается когда Acronis True image server начинает делать дефферентное ежеденевное резервное копирование на месте «Блокировка диска С». Так вот эта ерунда происходит по не понятным для меня причинам, в один вечер сливает бекапы нормально, на второй день при этой же процедуре вылетает. Так на что мне грешить? На Acronis? Хотя раньше все было нормально. НА один из дисков? Или на Raid контроллер. Жду ваших мыслей оп этому поводу, Заранее благодарю. |
allianceplayer,
Вы не указали сами модели винтов. Но в общем случае - раз Сигейты там, то вполне вероятно что на каком-то из них стали появляться дефекты. |
Интересная весч, отключил диферентное копирование на пару дней Акронисом, вроде все в порядке стало....Думаю, если включу, начнется та же самая канитель!!!Ну хотя бы понять причину данного не здорового поведения!!!!
|
Тестите винты по отдельности например на другом компе Викторией 4.46. СМАРТ и скан поверхности сделайте обязательно.
|
Думаете это однозначно винты?наткнулся вот на такой пост в нете прямо один в один проблема http://blog.karelia.pro/adengin/2007...a-informaciyu/
Но насколько я понял решением явилось разбитие раида и работой без него!!! |
Поверьте, я знаю как ведут себя Сигейты 11, 12 после работы в рэйде. И проблемы у них появляются ещё до года работы. Собственно, не хотите - не проверяйте винты. Особенно если там не хранится ничего особо важного.
|
В том то и дело что там хранится важная инфа...И действительно этим винтам еще полгода нет, как они начали в раиде работать. В случае выявления глюков именно в винтах, рекомендуете их сменить? Винты каких поризводиетелей на Ваш взгляд стоило бы использовать?
|
Цитата:
Цитата:
|
В комплектации с сервером шли два винта Сигейта, с наклейкой HP, только по заоблочным ценам...Так вот через два года работы один из винтов показал красненький фанарик, тем самым дав понять, что он сдох...И реально винт оказался мертвым.... Хотел уже заказывать такой же у HP. Вспомнил что есть такой же винтик в ящичке, только без этой наклеичке HP, вставил, все идеально у меня проработало еще 1,5 года..Пока не пришло время увеличивать дисковое пространство сервера... Купил 2 обычные ничем не примечательные 500 того же Сигейта, ну вот и результат в прицнипе...Буду проверять..,Спасибо БОЛЬШОЕ, за внимание и советы....
|
Отписываю о проделанной работе..Вообщем решил я на недельку отключить диферентное копирование, а на выходных просканировать винты...Во время этой недели винту работали нормально, ничего не слетало, все как надо...Даже не смотря на то, что выполнялось полное резервное копирование два раза, тем же Акронисом... Снял Винты проскинаил Викторией, СМАРТ показал что все good...Поверхность тоже чиста, без ошибок....Так что все таки грешу, на какой то сбой в программе Акронис....Лог СМАРТА с винтов ниже...
DISK1 ST500DM002-1BC142 Z2AAZERN ------------------------------------------------------------------------- ID Name Value Worst Tresh Raw Health ------------------------------------------------------------------------- 1 Raw read error rate 114 99 6 81384967 ••••• 3 Spin-up time 100 100 0 0 ••••• 4 Number of spin-up times 100 100 20 53 ••••• 5 Reallocated sector count 100 100 36 0 ••••• 7 Seek error rate 77 60 30 51406642 ••• 9 Power-on time 98 98 0 2125 •••• 10 Spin-up retries 100 100 97 0 ••••• 12 Start/stop count 100 100 20 53 ••••• 183 unknown attribut 100 100 0 0 ••••• 184 End-to-End error 100 100 99 0 ••••• 187 Reported UNC error 100 100 0 0 ••••• 188 Command timeout 100 96 0 4295098403 ••••• 189 High Fly writes 100 100 0 0 ••••• 190 Airflow temperature 81 63 45 19°C/66°F •••• 194 HDA Temperature 19 40 0 19°C/66°F •••• 194 Minimum temperature 90 40 0 14°C/57°F - 195 Hardware ECC recovered 46 33 0 81384967 •• 197 Current pending sectors 100 100 0 0 ••••• 198 Offline scan UNC sectors 100 100 0 0 ••••• 199 Ultra DMA CRC errors 200 200 0 0 ••••• 240 Head flying hours 100 253 0 254347963271389 ••••• 241 unknown attribut 100 253 0 1578186213 ••••• 242 unknown attribut 100 253 0 948735500 ••••• DISK2 ST500DM002-1BC142 Z2AAZER7 ------------------------------------------------------------------------- ID Name Value Worst Tresh Raw Health ------------------------------------------------------------------------- 1 Raw read error rate 117 99 6 153842852 ••••• 3 Spin-up time 100 100 0 0 ••••• 4 Number of spin-up times 100 100 20 40 ••••• 5 Reallocated sector count 100 100 36 0 ••••• 7 Seek error rate 77 60 30 55460101 ••• 9 Power-on time 98 98 0 2426 •••• 10 Spin-up retries 100 100 97 0 ••••• 12 Start/stop count 100 100 20 39 ••••• 183 unknown attribut 100 100 0 0 ••••• 184 End-to-End error 100 100 99 0 ••••• 187 Reported UNC error 100 100 0 0 ••••• 188 Command timeout 100 99 0 4295032849 ••••• 189 High Fly writes 100 100 0 0 ••••• 190 Airflow temperature 69 60 45 31°C/87°F •••• 194 HDA Temperature 31 40 0 31°C/87°F •••• 194 Minimum temperature 90 40 0 13°C/55°F - 195 Hardware ECC recovered 46 30 0 153842852 •• 197 Current pending sectors 100 100 0 0 ••••• 198 Offline scan UNC sectors 100 100 0 0 ••••• 199 Ultra DMA CRC errors 200 200 0 0 ••••• 240 Head flying hours 100 253 0 14843406977496 ••••• 241 unknown attribut 100 253 0 2374139564 ••••• 242 unknown attribut 100 253 0 3152625376 ••••• |
Вот теперь понятно, что Сигейты 12-й серии, обычные, не серверные, из новых. СМАРТы хорошие у обоих. Немного получше обычных 12-х. Можно считать что общее состояние у них хорошее и проблем нет пока. Будем считать что сбой был всё-таки софтовый. Единственное, что при вылете такого винта, поднимать его непростая задача, особенно если на момент вылета там будет находиться ценная инфа. Просто учитывайте, что эти Сигейты вылетают обычно резко, внезапно. Поэтому за ними нужно следить и любой сбой подозрителен.
|
misha2
Спасибо за Ваше доброе отношение и комментарии по проблеме..... Насколько я понимаю, все таки ваши рекомендации сводятся к смене данных винтов, на приведенные Вами модели выше!? |
В основном да. Хотя б потому, что в серверах с ценными данными должны стоять винты с повышенной надёжностью. А обычные Сигейт 12 к таковым не относятся. Тем более уж частенько неприятности с серверами упоминаются в связи с Сигейт 11, 12, на разных форумах.
|
Вы были абсолютно правы, дело в винтах...На днях опять перестал загружаться....Начал проверять один из винтов на ошибки на другом компе, а он висит на надписи Correcting error....Хотелось бы попросить, из Вашего личного опыта...Какую конкретную модельку из винтов WD вы можете посоветовать!?
Спасибо.. |
Вообще то для серверов подходят WD серий RE2, RE4, Enterprize, и Black ещё...
|
Спасибо за подсказку....Будем искать....А то реально, что то как то не нравится мне совсем как они работают!!!!
|
Я б всё-таки посмотрел бы их СМАРТ на стационарном, обычном компе Викторией 4.46. Чтоб быть уже уверенным.
|
Так я же и выставил логи, что показала виктория..Показала что все гууд...И сейчас тоже показывает...Скинирую естественно на другом компьютере!!!!
|
Да, на тех логах всё более-менее. А сканировали поверхность ? Ещё Сигейты страдают окислением контактных площадок с обратной стороны платы и их чистят ластиком. Из-за окисления винты могут сбоить тоже, запросто.
|
Поверхность так же сканировал...Все чисто никаких бедов и прочего, было несколько кластеров с задержками 200 ms, ну я думаю это не настолько критично, чтобы падать....Контакты так же чистил ластиком, один черт какая я то ерунда выходит....Сейчас уже до того дошло, что сервер загружается когда захочет,обновился допустим, перезагрузился, а загружатся не хочет.....Сказал мол ему надо на ошибки винты проверить, хотя за день до этого два винта проверял, chkdsk ошибки поправил....Сейчас сервер делает ресинхронизацию и на ошибки проверяет третий час...Вот и не могу понять то ли он завис, так как даже намлок не реагирует, то ли работает....Вообщем с самого начала Вы правильно говорили глючные это винты, это уже не тот Сигейт что был раньше.....
|
Цитата:
|
Не сдается мне
то все таки винты...Так как один из них постоянно просит провериться на ошибки!!!Уже дал запрос на покупку тех что вы мне посоветовали из серии RE....Осталось их только найти, так как рынок у нас особо не развит!!! |
Дело в том что и сам продавец должен знать какие винты Raid Edition, а какие EnterPrize. Часто в прайсах не указывается серия. И тогда выбор зависит от квалификации продавца.
|
В том месте где я на данный момент нахожусь квалификация продавцов оставляет желать лучшего...А такие винты редкость...Большинство поставщиков в глаза таких винтов не видели...Придется под заказ искать!!!!
|
MISHA2
Что бы Вы посоветовали из вот этих двух варинтов на мой SAS адаптер SAS1064E http://www.fdcinternational.com/prod...tern%20Digital или http://www.fdcinternational.com/prod...tern%20Digital |
Цитата:
|
Да, оба относятся к RE4. Хорошие винты. Но учитивайте, что нет "вечных" винтов.
|
Спасибо БОЛЬШОЕ...Да мне хотя бы избавиться от этой головной боли, когда в спешке что-то предпринимаешь что бы запустить сервер. Уж сильно часто стало это повторяться......
|
Всем спасибо!!Поставил Винта серии RE4, работают тьфу тьфу....Но резервное копирование акронисом нет нет, выбивает сервер, но РАИД уже не слетает, думаю пора переходить на версию акрониса помоложе....:-)Ну это уже совсем другая история!!!!
|
Время: 18:44. |
Время: 18:44.
© OSzone.net 2001-