Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Накопители (SSD, HDD, USB Flash) (http://forum.oszone.net/forumdisplay.php?f=53)
-   -   Проверить состояние HDD на физическом сервере Debian (http://forum.oszone.net/showthread.php?t=348017)

jonikster 17-02-2021 07:46 2950404

Проверить состояние HDD на физическом сервере Debian
 
Здравствуйте.
Есть физический сервер на Debian. Хочу проверить состояние дисков. Как это можно осуществить?
iostat выдает:
Linux 4.19.0-13-amd64 (ryzhikov) 02/16/2021 _x86_64_(8 CPU)

avg-cpu: %user %nice %system %iowait %steal %idle
0.04 0.00 0.03 0.03 0.00 99.90

Device r/s w/s rkB/s wkB/s rrqm/s wrqm/s %rrqm %wrqm r_await w_await aqu-sz rareq-sz wareq-sz svctm %util
sdb 0.09 1.19 3.15 9.70 0.00 0.60 0.86 33.71 8.97 6.43 0.01 33.77 8.16 3.48 0.45
sda 0.23 1.34 29.26 9.70 0.00 0.60 0.30 31.10 7.40 4.94 0.00 129.52 7.25 0.68 0.11
md1 0.00 0.00 0.07 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 21.39 0.00 0.00 0.00
md2 0.29 1.11 8.60 9.11 0.00 0.00 0.00 0.00 0.00 0.00 0.00 29.63 8.19 0.00 0.00

Попробовал badblocks, он начал работу, а потом ssh вылетел.
Если iostat недостаточно, что можно попробовать?
Заранее благодарен!

NickM 17-02-2021 09:58 2950419

Цитата:

Цитата jonikster
Хочу проверить состояние дисков. Как это можно осуществить? »

smartctl?

Jula0071 17-02-2021 13:43 2950439

sudo apt update && sudo apt install smartmontools
sudo smartctl -a /dev/sda
sudo smartctl -a /dev/sdb

Выхлоп интерпертируйте сами (там обычный отчёт смарта) либо сюда.

PS от обрывов соединения помогает screen.

jonikster 18-02-2021 00:28 2950504

Jula0071,
smartctl -a /dev/sda
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-13-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor: FUJITSU
Product: MBA3147RC
Revision: 0103
User Capacity: 147,086,327,808 bytes [147 GB]
Logical block size: 512 bytes
Rotation Rate: 15000 rpm
Logical Unit id: 0x500000e01b717ab0
Serial number: BJA0P8502D8M
Device type: disk
Transport protocol: SAS (SPL-3)
Local Time is: Wed Feb 17 16:25:48 2021 EST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Current Drive Temperature: 29 C
Drive Trip Temperature: 65 C

Manufactured in week 21 of year 2008
Specified cycle count over device lifetime: 50000
Accumulated start-stop cycles: 32
Elements in grown defect list: 0

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 3064 0 0 0 724489.125 0
write: 0 0 0 0 0 297713.824 0

Non-medium error count: 27

No self-tests have been logged

smartctl -a /dev/sdb
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-13-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor: FUJITSU
Product: MAX3147RC
Revision: 0104
User Capacity: 147,086,327,808 bytes [147 GB]
Logical block size: 512 bytes
Rotation Rate: 15000 rpm
Logical Unit id: 0x500000e0137d1e10
Serial number: DQ00P6B00K3R
Device type: disk
Transport protocol: SAS (SPL-3)
Local Time is: Wed Feb 17 16:26:03 2021 EST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Current Drive Temperature: 26 C
Drive Trip Temperature: 65 C

Manufactured in week 47 of year 2006
Specified cycle count over device lifetime: 10000
Accumulated start-stop cycles: 36
Elements in grown defect list: 0

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 2861 0 0 0 106551.613 0
write: 0 974 0 0 0 20344.597 0

Non-medium error count: 83

No self-tests have been logged

NickM 18-02-2021 00:39 2950505

Цитата:

Цитата jonikster
Non-medium error count: 27 »

Цитата:

Цитата jonikster
Non-medium error count: 83 »

Настораживает, но конечно ни о чём...

jonikster 18-02-2021 01:35 2950508

NickM, Если кратко.
1. Стоит ли проводить замену HDD?
2. В дальнейшем при тестировании на что обращать внимание, чтобы понимать, стоит или нет?

NickM 18-02-2021 06:37 2950517

1.
13-15 летние ж/диски это кончено круто.
Замену стоит производить, если у Вас имеется на то основания и потребность - полагаю они у Вас в RAID-1 и под системой? И Вам их по производительности и объему хватает?

2.
Цитата:

Цитата jonikster
Non-medium error count »

Это общая информация и не даёт никакой конкретики.
К сожалению утилита не "раскрыла" весь СМАРТ, ну или ж/д его не отдали.

Для SAS можно контролировать эти параметры:

Цитата:

Цитата jonikster
Error counter log:
read:
write: »

а также лог self-теста, может здесь почерпнете некоторую информацию?
Кстати, self-тест на Ваших лисках ни разу не выполнялся:
Цитата:

Цитата jonikster
No self-tests have been logged»


Jula0071 18-02-2021 15:02 2950565

Для возраста состояние отличное.
Цитата:

Цитата NickM
Это общая информация и не даёт никакой конкретики. »

Для такого пробега совершенно мизерное количество ошибок. Но конечно возраст... И сейчас наверно сложно будет быстро достать замену, случись что. Я бы поменял заранее, если бюджет на это есть. На ссд, можно даже сата самсунг про, если корзина позволяет.
Цитата:

Цитата NickM
К сожалению утилита не "раскрыла" весь СМАРТ, ну или ж/д его не отдали. »

SAS часто не отдают явно атрибуты.


Время: 23:39.

Время: 23:39.
© OSzone.net 2001-