Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Накопители (SSD, HDD, USB Flash) (http://forum.oszone.net/forumdisplay.php?f=53)
-   -   [решено] Проблемы с SAS контроллером или с жестким? (http://forum.oszone.net/showthread.php?t=231651)

allianceplayer 30-03-2012 08:06 1889774

Проблемы с SAS контроллером или с жестким?
 
Доброе утро уважаемые форумчане,

Надеюсь на ваши мудрые советы..

Дело в том что имеется сервер HP ML 150 G5 в нем два жестких SATA 500 Gb Seagate, SAS контроллер SAS1064E, RAID 1 стоит. Все работало прекрасно более двух лет. Проблема началась недели две назад после установки Acronis Console, для удаленного резервного копирования.

На утро пришел NTLDR is Missing перегружаю, нажимаю три волшебных клавиши, пошла перезагрузка. Сервер отказывается видеть RAID controller как будто его там и нет. Выключаю сервер, включаю, контроллер увидел но РЕЙД в состоянии degraded и пошел ребилд дисков. Снес этот Акронис консоль к черту. Ребилд через часов 12-15 завершился, все диски работают нормально зелененькие довольные огоньки мигают.

Прихожу через пару дней опять NTLDR is missing. Ситуация один в один…Смотрю логи…Перезагрузка системы начинается когда Acronis True image server начинает делать дефферентное ежеденевное резервное копирование на месте «Блокировка диска С». Так вот эта ерунда происходит по не понятным для меня причинам, в один вечер сливает бекапы нормально, на второй день при этой же процедуре вылетает.

Так на что мне грешить? На Acronis? Хотя раньше все было нормально. НА один из дисков? Или на Raid контроллер.
Жду ваших мыслей оп этому поводу,
Заранее благодарю.

misha2 03-04-2012 09:06 1892356

allianceplayer,
Вы не указали сами модели винтов. Но в общем случае - раз Сигейты там, то вполне вероятно что на каком-то из них стали появляться дефекты.

allianceplayer 03-04-2012 13:33 1892505

Интересная весч, отключил диферентное копирование на пару дней Акронисом, вроде все в порядке стало....Думаю, если включу, начнется та же самая канитель!!!Ну хотя бы понять причину данного не здорового поведения!!!!

misha2 03-04-2012 14:04 1892532

Тестите винты по отдельности например на другом компе Викторией 4.46. СМАРТ и скан поверхности сделайте обязательно.

allianceplayer 03-04-2012 14:10 1892539

Думаете это однозначно винты?наткнулся вот на такой пост в нете прямо один в один проблема http://blog.karelia.pro/adengin/2007...a-informaciyu/

Но насколько я понял решением явилось разбитие раида и работой без него!!!

misha2 03-04-2012 14:26 1892550

Поверьте, я знаю как ведут себя Сигейты 11, 12 после работы в рэйде. И проблемы у них появляются ещё до года работы. Собственно, не хотите - не проверяйте винты. Особенно если там не хранится ничего особо важного.

allianceplayer 03-04-2012 14:57 1892579

В том то и дело что там хранится важная инфа...И действительно этим винтам еще полгода нет, как они начали в раиде работать. В случае выявления глюков именно в винтах, рекомендуете их сменить? Винты каких поризводиетелей на Ваш взгляд стоило бы использовать?

misha2 03-04-2012 15:03 1892583

Цитата:

Цитата allianceplayer
В случае выявления глюков именно в винтах, рекомендуете их сменить? »

А как вы сами думаете ? Особенно, если -
Цитата:

Цитата allianceplayer
В том то и дело что там хранится важная инфа... »

А винты в рэйд ставят именно рейдовые, типа WD серий RE (Raid Edition), Enterprize (хотя б) или Black, это если говорить про альтернативу Сигейту. Ведь выбор небогат - Самсунг перешёл под крылышко Сигейт, а Хитачи к WD.

allianceplayer 03-04-2012 15:39 1892625

В комплектации с сервером шли два винта Сигейта, с наклейкой HP, только по заоблочным ценам...Так вот через два года работы один из винтов показал красненький фанарик, тем самым дав понять, что он сдох...И реально винт оказался мертвым.... Хотел уже заказывать такой же у HP. Вспомнил что есть такой же винтик в ящичке, только без этой наклеичке HP, вставил, все идеально у меня проработало еще 1,5 года..Пока не пришло время увеличивать дисковое пространство сервера... Купил 2 обычные ничем не примечательные 500 того же Сигейта, ну вот и результат в прицнипе...Буду проверять..,Спасибо БОЛЬШОЕ, за внимание и советы....

allianceplayer 09-04-2012 07:52 1896036

Отписываю о проделанной работе..Вообщем решил я на недельку отключить диферентное копирование, а на выходных просканировать винты...Во время этой недели винту работали нормально, ничего не слетало, все как надо...Даже не смотря на то, что выполнялось полное резервное копирование два раза, тем же Акронисом... Снял Винты проскинаил Викторией, СМАРТ показал что все good...Поверхность тоже чиста, без ошибок....Так что все таки грешу, на какой то сбой в программе Акронис....Лог СМАРТА с винтов ниже...


DISK1


ST500DM002-1BC142 Z2AAZERN
-------------------------------------------------------------------------
ID Name Value Worst Tresh Raw Health
-------------------------------------------------------------------------
1 Raw read error rate 114 99 6 81384967 •••••
3 Spin-up time 100 100 0 0 •••••
4 Number of spin-up times 100 100 20 53 •••••
5 Reallocated sector count 100 100 36 0 •••••
7 Seek error rate 77 60 30 51406642 •••
9 Power-on time 98 98 0 2125 ••••
10 Spin-up retries 100 100 97 0 •••••
12 Start/stop count 100 100 20 53 •••••
183 unknown attribut 100 100 0 0 •••••
184 End-to-End error 100 100 99 0 •••••
187 Reported UNC error 100 100 0 0 •••••
188 Command timeout 100 96 0 4295098403 •••••
189 High Fly writes 100 100 0 0 •••••
190 Airflow temperature 81 63 45 19°C/66°F ••••
194 HDA Temperature 19 40 0 19°C/66°F ••••
194 Minimum temperature 90 40 0 14°C/57°F -
195 Hardware ECC recovered 46 33 0 81384967 ••
197 Current pending sectors 100 100 0 0 •••••
198 Offline scan UNC sectors 100 100 0 0 •••••
199 Ultra DMA CRC errors 200 200 0 0 •••••
240 Head flying hours 100 253 0 254347963271389 •••••
241 unknown attribut 100 253 0 1578186213 •••••
242 unknown attribut 100 253 0 948735500 •••••




DISK2
ST500DM002-1BC142 Z2AAZER7
-------------------------------------------------------------------------
ID Name Value Worst Tresh Raw Health
-------------------------------------------------------------------------
1 Raw read error rate 117 99 6 153842852 •••••
3 Spin-up time 100 100 0 0 •••••
4 Number of spin-up times 100 100 20 40 •••••
5 Reallocated sector count 100 100 36 0 •••••
7 Seek error rate 77 60 30 55460101 •••
9 Power-on time 98 98 0 2426 ••••
10 Spin-up retries 100 100 97 0 •••••
12 Start/stop count 100 100 20 39 •••••
183 unknown attribut 100 100 0 0 •••••
184 End-to-End error 100 100 99 0 •••••
187 Reported UNC error 100 100 0 0 •••••
188 Command timeout 100 99 0 4295032849 •••••
189 High Fly writes 100 100 0 0 •••••
190 Airflow temperature 69 60 45 31°C/87°F ••••
194 HDA Temperature 31 40 0 31°C/87°F ••••
194 Minimum temperature 90 40 0 13°C/55°F -
195 Hardware ECC recovered 46 30 0 153842852 ••
197 Current pending sectors 100 100 0 0 •••••
198 Offline scan UNC sectors 100 100 0 0 •••••
199 Ultra DMA CRC errors 200 200 0 0 •••••
240 Head flying hours 100 253 0 14843406977496 •••••
241 unknown attribut 100 253 0 2374139564 •••••
242 unknown attribut 100 253 0 3152625376 •••••

misha2 09-04-2012 08:34 1896051

Вот теперь понятно, что Сигейты 12-й серии, обычные, не серверные, из новых. СМАРТы хорошие у обоих. Немного получше обычных 12-х. Можно считать что общее состояние у них хорошее и проблем нет пока. Будем считать что сбой был всё-таки софтовый. Единственное, что при вылете такого винта, поднимать его непростая задача, особенно если на момент вылета там будет находиться ценная инфа. Просто учитывайте, что эти Сигейты вылетают обычно резко, внезапно. Поэтому за ними нужно следить и любой сбой подозрителен.

allianceplayer 09-04-2012 12:04 1896148

misha2

Спасибо за Ваше доброе отношение и комментарии по проблеме..... Насколько я понимаю, все таки ваши рекомендации сводятся к смене данных винтов, на приведенные Вами модели выше!?

misha2 09-04-2012 12:17 1896154

В основном да. Хотя б потому, что в серверах с ценными данными должны стоять винты с повышенной надёжностью. А обычные Сигейт 12 к таковым не относятся. Тем более уж частенько неприятности с серверами упоминаются в связи с Сигейт 11, 12, на разных форумах.

allianceplayer 14-04-2012 13:23 1899450

Вы были абсолютно правы, дело в винтах...На днях опять перестал загружаться....Начал проверять один из винтов на ошибки на другом компе, а он висит на надписи Correcting error....Хотелось бы попросить, из Вашего личного опыта...Какую конкретную модельку из винтов WD вы можете посоветовать!?

Спасибо..

misha2 14-04-2012 13:34 1899460

Вообще то для серверов подходят WD серий RE2, RE4, Enterprize, и Black ещё...

allianceplayer 14-04-2012 13:51 1899470

Спасибо за подсказку....Будем искать....А то реально, что то как то не нравится мне совсем как они работают!!!!

misha2 14-04-2012 14:09 1899482

Я б всё-таки посмотрел бы их СМАРТ на стационарном, обычном компе Викторией 4.46. Чтоб быть уже уверенным.

allianceplayer 14-04-2012 15:27 1899527

Так я же и выставил логи, что показала виктория..Показала что все гууд...И сейчас тоже показывает...Скинирую естественно на другом компьютере!!!!

misha2 14-04-2012 15:46 1899539

Да, на тех логах всё более-менее. А сканировали поверхность ? Ещё Сигейты страдают окислением контактных площадок с обратной стороны платы и их чистят ластиком. Из-за окисления винты могут сбоить тоже, запросто.

allianceplayer 15-04-2012 18:05 1900202

Поверхность так же сканировал...Все чисто никаких бедов и прочего, было несколько кластеров с задержками 200 ms, ну я думаю это не настолько критично, чтобы падать....Контакты так же чистил ластиком, один черт какая я то ерунда выходит....Сейчас уже до того дошло, что сервер загружается когда захочет,обновился допустим, перезагрузился, а загружатся не хочет.....Сказал мол ему надо на ошибки винты проверить, хотя за день до этого два винта проверял, chkdsk ошибки поправил....Сейчас сервер делает ресинхронизацию и на ошибки проверяет третий час...Вот и не могу понять то ли он завис, так как даже намлок не реагирует, то ли работает....Вообщем с самого начала Вы правильно говорили глючные это винты, это уже не тот Сигейт что был раньше.....

misha2 15-04-2012 18:10 1900204

Цитата:

Цитата allianceplayer
Сейчас уже до того дошло, что сервер загружается когда захочет,обновился допустим, перезагрузился, а загружатся не хочет.....Сказал мол ему надо на ошибки винты проверить, хотя за день до этого два винта проверял, chkdsk ошибки поправил...Вообщем с самого начала Вы правильно говорили глючные это винты, это уже не тот Сигейт что был раньше..... »

Но я и не исключаю проблем и с самим сервером. Погонять бы эти винтики на другом компе, дней несколько...

allianceplayer 16-04-2012 11:50 1900580

Не сдается мне
то все таки винты...Так как один из них постоянно просит провериться на ошибки!!!Уже дал запрос на покупку тех что вы мне посоветовали из серии RE....Осталось их только найти, так как рынок у нас особо не развит!!!

misha2 16-04-2012 11:53 1900582

Дело в том что и сам продавец должен знать какие винты Raid Edition, а какие EnterPrize. Часто в прайсах не указывается серия. И тогда выбор зависит от квалификации продавца.

allianceplayer 16-04-2012 12:17 1900594

В том месте где я на данный момент нахожусь квалификация продавцов оставляет желать лучшего...А такие винты редкость...Большинство поставщиков в глаза таких винтов не видели...Придется под заказ искать!!!!

allianceplayer 23-04-2012 13:35 1904472

MISHA2

Что бы Вы посоветовали из вот этих двух варинтов на мой SAS адаптер SAS1064E

http://www.fdcinternational.com/prod...tern%20Digital

или

http://www.fdcinternational.com/prod...tern%20Digital

Ment69 23-04-2012 14:00 1904483

Цитата:

Цитата allianceplayer
то бы Вы посоветовали из вот этих двух варинтов »

По вашим ссылкам не указаны модели но судя по RE - это Raid Edition, оба.

misha2 23-04-2012 15:11 1904518

Да, оба относятся к RE4. Хорошие винты. Но учитивайте, что нет "вечных" винтов.

allianceplayer 23-04-2012 16:04 1904552

Спасибо БОЛЬШОЕ...Да мне хотя бы избавиться от этой головной боли, когда в спешке что-то предпринимаешь что бы запустить сервер. Уж сильно часто стало это повторяться......

allianceplayer 15-05-2012 12:30 1916254

Всем спасибо!!Поставил Винта серии RE4, работают тьфу тьфу....Но резервное копирование акронисом нет нет, выбивает сервер, но РАИД уже не слетает, думаю пора переходить на версию акрониса помоложе....:-)Ну это уже совсем другая история!!!!


Время: 18:44.

Время: 18:44.
© OSzone.net 2001-