RAID 1 uszkodzony

Tworzenie wątków jest zablokowane - należy używać formularza "Zadaj pytanie".
Regulamin działu
Tworzenie wątków jest zablokowane - należy używać formularza "Zadaj pytanie".

RAID 1 uszkodzony

Postprzez jdoe77 » 28 maja 2010, o 19:27

Serwer

Numer seryjny: A3GCN01695
Model: DS209+II
Firmware: inne A3GCN01695
Zainstalowane paczki:

Z jakich usług korzystasz:

DIR-635ISP:Lanet 2Mb/512kb

Inne

Używam: do celów prywatnych
Model dysku: 2x WDC WD15EARS
System operacyjny: Windows

RAID 1 uszkodzony

Sytuacja następująca: system zgłasza uszkodzenie RAID, z opisem:
Ponieważ konsystencja danych na tym wolumenie nie jest pełna, wolumen zostanie tylko do odczytu. Może to wynikać ze złych sektorów na dysku twardym. Skopiuj dane z wolumenu przed usunięciem wolumenu i utworzeniem nowego na nowym twardym dysku.
Kiedy usuwasz twarde dyski, zwróć uwagę, że co najmniej jeden dysk systemowy [ Dysk 1 Dysk 2] powinien zostać zachowany, aby system działał normalnie.


A każdy z dysków ma status normalny.
Po zalogowaniu się na konsolę i wydaniu polecenia mdadm wynik następujący:
Kod: Zaznacz cały
MATRIX> mdadm --detail /dev/md2
/dev/md2:
        Version : 1.01
  Creation Time : Sat Apr 10 15:56:57 2010
     Raid Level : raid1
     Array Size : 1461995193 (1394.27 GiB 1497.08 GB)
  Used Dev Size : 1461995193 (1394.27 GiB 1497.08 GB)
   Raid Devices : 2
  Total Devices : 2
    Persistence : Superblock is persistent

    Update Time : Fri May 28 19:40:43 2010
          State : clean
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

           Name : MATRIX:2  (local to host MATRIX)
           UUID : f16bcca6:2e8a4775:efc32572:d61adf75
         Events : 32

    Number   Major   Minor   RaidDevice State
       0       8        3        0      active sync   /dev/hda3
       1       8       19        1      active sync   /dev/sdb3

czyli - niby wszystko OK (status - clean).
Mały rzut oka na /var/log/messages, i tu ciekawostka:
Kod: Zaznacz cały
May 28 16:11:42 kernel: ata2.00: read unc at 1468156640
May 28 16:11:42 kernel: LBA 1 start 0 end 1468156640
May 28 16:11:42 kernel: sdb3 auto_remap 0
May 28 16:11:42 kernel: ata2.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x
May 28 16:11:42 kernel: ata2.00: irq_stat 0x00020002, device error via SDB FIS
May 28 16:11:42 kernel: ata2.00: cmd 60/08:00:df:4a:82/00:00:57:00:00/40 tag 0 n
May 28 16:11:42 kernel:          res 41/40:00:e0:4a:82/c6:00:57:00:00/40 Emask 0
May 28 16:11:42 kernel: ata2.00: status: { DRDY ERR }
May 28 16:11:42 kernel: ata2.00: error: { UNC }
May 28 16:11:42 kernel: ata2.00: read unc at 1468156640
May 28 16:11:42 kernel: LBA 1 start 0 end 1468156640
May 28 16:11:42 kernel: sdb3 auto_remap 0
May 28 16:11:42 kernel: ata2.00: exception Emask 0x0 SAct 0x3 SErr 0x0 action 0x
May 28 16:11:42 kernel: ata2.00: irq_stat 0x00060002, device error via SDB FIS
May 28 16:11:42 kernel: ata2.00: cmd 60/08:00:df:4a:82/00:00:57:00:00/40 tag 0 n
May 28 16:11:42 kernel:          res 41/40:00:e0:4a:82/9c:00:57:00:00/40 Emask 0
May 28 16:11:42 kernel: ata2.00: status: { DRDY ERR }
May 28 16:11:42 kernel: ata2.00: error: { UNC }
May 28 16:11:42 kernel: ata2.00: read unc at 1468156640
May 28 16:11:42 kernel: LBA 1 start 0 end 1468156640
May 28 16:11:42 kernel: sdb3 auto_remap 0
May 28 16:11:42 kernel: ata2.00: exception Emask 0x0 SAct 0x2 SErr 0x0 action 0x
May 28 16:11:42 kernel: ata2.00: irq_stat 0x00060002, device error via SDB FIS
May 28 16:11:42 kernel: ata2.00: cmd 60/08:08:df:4a:82/00:00:57:00:00/40 tag 1 n
May 28 16:11:42 kernel:          res 41/40:00:e0:4a:82/c6:00:57:00:00/40 Emask 0
May 28 16:11:42 kernel: ata2.00: status: { DRDY ERR }
May 28 16:11:42 kernel: ata2.00: error: { UNC }
May 28 16:11:43 kernel: ata2.00: read unc at 1468156640
May 28 16:11:43 kernel: LBA 1 start 0 end 1468156640
May 28 16:11:43 kernel: sdb3 auto_remap 0
May 28 16:11:43 kernel: ata2.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x
May 28 16:11:43 kernel: ata2.00: irq_stat 0x00060002, device error via SDB FIS
May 28 16:11:43 kernel: ata2.00: cmd 60/08:00:df:4a:82/00:00:57:00:00/40 tag 0 n
May 28 16:11:43 kernel:          res 41/40:00:e0:4a:82/c6:00:57:00:00/40 Emask 0
May 28 16:11:43 kernel: ata2.00: status: { DRDY ERR }
May 28 16:11:43 kernel: ata2.00: error: { UNC }
May 28 16:11:43 kernel: ata2.00: read unc at 1468156640
May 28 16:11:43 kernel: LBA 1 start 0 end 1468156640
May 28 16:11:43 kernel: sdb3 auto_remap 0
May 28 16:11:43 kernel: ata2.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x
May 28 16:11:43 kernel: ata2.00: irq_stat 0x00060002, device error via SDB FIS
May 28 16:11:43 kernel: ata2.00: cmd 60/08:00:df:4a:82/00:00:57:00:00/40 tag 0 n
May 28 16:11:43 kernel:          res 41/40:00:e0:4a:82/3f:00:57:00:00/40 Emask 0
May 28 16:11:43 kernel: ata2.00: status: { DRDY ERR }
May 28 16:11:43 kernel: ata2.00: error: { UNC }
May 28 16:11:43 kernel: ata2.00: read unc at 1468156640
May 28 16:11:43 kernel: LBA 1 start 0 end 1468156640
May 28 16:11:43 kernel: sdb3 auto_remap 0
May 28 16:11:43 kernel: ata2.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x
May 28 16:11:43 kernel: ata2.00: irq_stat 0x00060002, device error via SDB FIS
May 28 16:11:43 kernel: ata2.00: cmd 60/08:00:df:4a:82/00:00:57:00:00/40 tag 0 n
May 28 16:11:43 kernel:          res 41/40:00:e0:4a:82/c6:00:57:00:00/40 Emask 0
May 28 16:11:43 kernel: ata2.00: status: { DRDY ERR }
May 28 16:11:43 kernel: ata2.00: error: { UNC }
May 28 16:13:45 kernel: journal_bmap: journal block not found at offset 19596 on
May 28 16:13:45 kernel: Aborting journal on device md2.
May 28 16:13:45 kernel: ext3_abort called.
May 28 16:13:45 kernel: EXT3-fs error (device md2): ext3_journal_start_sb: Detec
May 28 16:13:45 kernel: Remounting filesystem read-only
May 28 16:13:45 scemd: modules/raid_data_volume_check.c:812 Volume /volume1 cras
May 28 16:13:58 scheduler: scheduler.c (1607) Got signal. Die gracefully.
May 28 16:13:58 scheduler: scheduler.c (1621) rTorrent is alive. Sleep 1 second.
May 28 16:13:59 scheduler: scheduler.c (1621) rTorrent is alive. Sleep 1 second.
May 28 16:14:00 scheduler: scheduler.c (1621) rTorrent is alive. Sleep 1 second.
May 28 16:14:01 scheduler: scheduler.c (1621) rTorrent is alive. Sleep 1 second.
May 28 16:14:02 scheduler: scheduler.c (1621) rTorrent is alive. Sleep 1 second.
May 28 16:14:03 scheduler: scheduler.c (1621) rTorrent is alive. Sleep 1 second.
May 28 16:14:04 rtorrent: SYNODownloadExitSaveSeesion done
May 28 16:14:04 scheduler: scheduler.c (1625) rTorrent is killed.
May 28 16:14:15 kernel: fs/dquot.c (547) Read only filesystem. Just skip quota s
May 28 16:14:15 kernel: fs/dquot.c (547) Read only filesystem. Just skip quota s
May 28 16:14:15 kernel: fs/dquot.c (547) Read only filesystem. Just skip quota s
May 28 16:14:15 kernel: fs/dquot.c (547) Read only filesystem. Just skip quota s
May 28 16:14:15 kernel: ext3_abort called.
May 28 16:14:15 kernel: EXT3-fs error (device md2): ext3_remount: Abort forced b
May 28 16:14:33 scheduler: taskget.c (266) Failed to open /volume1/@download/32/
May 28 16:14:33 scheduler: scheduler.c (862) Failed to write torrent to file
May 28 16:14:33 scheduler: scheduler.c (1355) Failed to start task id 32
May 28 16:14:34 scemd: modules/raid_data_volume_check.c:885 /volume1 state chang
May 28 16:14:39 scheduler: taskget.c (266) Failed to open /volume1/@download/32/
May 28 16:14:39 scheduler: scheduler.c (862) Failed to write torrent to file
May 28 16:14:39 scheduler: scheduler.c (1355) Failed to start task id 32
May 28 16:14:44 scheduler: taskget.c (266) Failed to open /volume1/@download/32/
May 28 16:14:44 scheduler: scheduler.c (862) Failed to write torrent to file
May 28 16:14:44 scheduler: scheduler.c (1355) Failed to start task id 32
May 28 16:14:49 scheduler: taskget.c (266) Failed to open /volume1/@download/32/
May 28 16:14:49 scheduler: scheduler.c (862) Failed to write torrent to file
May 28 16:14:49 scheduler: scheduler.c (1355) Failed to start task id 32


I co mam zrobić dalej? Z ciekawostek - po restarcie wszystko wraca do normy.
Czy mam szukać badbloków na dysku? A ważniejsze - czy dane na takim RAID mogą ulec uszkodzeniu?
Z wszystkich form monotonii najgorsze jest potwierdzanie.
jdoe77
Amator
 
Posty: 38
Dołączył(a): 16 mar 2010, o 13:04
Lokalizacja: Wrocław
Medale: 3
Syn (3)
Synology: DS209+II
Firmware: DSM 3.0-1337
Dyski: 2 x 1,5TB WD EARS
Pochodzenie: Wrocław
Internet: 4 MB
Płeć: Mężczyzna
System Operacyjny: W7HP 64
Router/Switch: DIR-635


Re: RAID 1 uszkodzony

Postprzez jdoe77 » 28 maja 2010, o 19:30

A - wielkie sorry za formatowanie. I za błąd - firmware to DSM 2.3-1141.

Wykonałem przed chwilą sprawdzenie dysku, poniżej wynik:
Kod: Zaznacz cały
MATRIX> umount -f /dev/md2
MATRIX> umount -f /opt
MATRIX> e2fsck -v -n -f /dev/md2
e2fsck 1.41.3 (12-Oct-2008)
Warning: skipping journal recovery because doing a read-only filesystem check.
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information

  169883 inodes used (0.19%)
   12612 non-contiguous inodes (7.4%)
         # of inodes with ind/dind/tind blocks: 61820/6011/15
155536653 blocks used (42.55%)
       0 bad blocks
      42 large files

  141941 regular files
   26806 directories
       0 character device files
       0 block device files
       0 fifos
     417 links
    1127 symbolic links (1127 fast symbolic links)
       0 sockets
--------
  170291 files
MATRIX>

Z wszystkich form monotonii najgorsze jest potwierdzanie.
jdoe77
Amator
 
Posty: 38
Dołączył(a): 16 mar 2010, o 13:04
Lokalizacja: Wrocław
Medale: 3
Syn (3)
Synology: DS209+II
Firmware: DSM 3.0-1337
Dyski: 2 x 1,5TB WD EARS
Pochodzenie: Wrocław
Internet: 4 MB
Płeć: Mężczyzna
System Operacyjny: W7HP 64
Router/Switch: DIR-635

Re: RAID 1 uszkodzony

Postprzez terrorite » 28 maja 2010, o 20:32

Wyglada na to ze masz dosc spory problem z hdd, mozesz sprobowac odmontowac partycje i sprawdzic przez e2fsck -fnv /device czy tez pozniej nawet e2fsck -fpcy /device.

No tak tyle ze:
May 28 16:13:45 kernel: journal_bmap: journal block not found at offset 19596
May 28 16:13:45 kernel: Aborting journal on device md2.
oraz:
Warning: skipping journal recovery because doing a read-only filesystem check.
No to ze tak powiem niewiele sie zmienilo.
Obrazek
Avatar użytkownika
terrorite
Zawsze On-Line
 
Posty: 447
Dołączył(a): 19 lis 2009, o 16:31
Medale: 9
Syn (2) Wiedza (3)
Linux (1) Zasługi (3)
Synology: DS409
Firmware: 2.3
Dyski: ST31000528AS
Pochodzenie: Warszawa
Internet: 25Mb
Płeć: Mężczyzna

Re: RAID 1 uszkodzony

Postprzez jdoe77 » 28 maja 2010, o 21:23

OK, dzięki. Robię kopię zapasową co ważniejszych danych, jeszcze w nocy postaram się sprawdzić dyski.
Czy oprócz e2fsck są jeszcze jakieś narzędzia dostępne na DS-y? Czego można jeszcze użyć?
Z wszystkich form monotonii najgorsze jest potwierdzanie.
jdoe77
Amator
 
Posty: 38
Dołączył(a): 16 mar 2010, o 13:04
Lokalizacja: Wrocław
Medale: 3
Syn (3)
Synology: DS209+II
Firmware: DSM 3.0-1337
Dyski: 2 x 1,5TB WD EARS
Pochodzenie: Wrocław
Internet: 4 MB
Płeć: Mężczyzna
System Operacyjny: W7HP 64
Router/Switch: DIR-635

Re: RAID 1 uszkodzony

Postprzez terrorite » 28 maja 2010, o 21:43

Na przyklad hdparm, tak przy okazji to jak zrzucisz dane z tego walnietego dysku to sprobuj go wyjac, wsadzic gdzies do kompa i przeskanowac jakas victoria albo mhdd. Potem zdjac wszystkie partycje, wlozyc do syno i odbudowac raid. No chyba ze mhdd powie ze to juz cegla a nie dysk.
Obrazek
Avatar użytkownika
terrorite
Zawsze On-Line
 
Posty: 447
Dołączył(a): 19 lis 2009, o 16:31
Medale: 9
Syn (2) Wiedza (3)
Linux (1) Zasługi (3)
Synology: DS409
Firmware: 2.3
Dyski: ST31000528AS
Pochodzenie: Warszawa
Internet: 25Mb
Płeć: Mężczyzna

Re: RAID 1 uszkodzony

Postprzez Krwiak » 28 maja 2010, o 21:44

Jeżeli masz jeszcze starą wersję serwera to pewnie dyski są podpięte do płyty główne kablami, jeżeli tak jest to sprawdź jest bo czasami to one są powodem problemów.
Avatar użytkownika
Krwiak
Administrator
 
Posty: 1637
Dołączył(a): 23 sty 2009, o 10:13
Medale: 3
Syn (1) Wiedza (2)
Synology: DS712+
Firmware: DSM 3.2-1944
Dyski: WD5000BEKT-00KA9
Pochodzenie: Szczecin
Internet: Multimedia 20MB
Płeć: Mężczyzna
System Operacyjny: Win 7 Ultimate 64Bit
Router/Switch: BUFFALO WZR-HP-G300NH

Re: RAID 1 uszkodzony

Postprzez jdoe77 » 29 maja 2010, o 07:43

OK, e2fsck poszło, poniżej wyniki:
Kod: Zaznacz cały
MATRIX> e2fsck -f -p -c /dev/md2
sh: badblocks: not found
1.41.3-1141: Updating bad block inode.
1.41.3-1141: 169882/91381760 files (7.4% non-contiguous), 155536652/365498798 blocks



Czy sprawdzać czymś jeszcze, czy to by już oznaczało że filesystem jest sprawny?
Z wszystkich form monotonii najgorsze jest potwierdzanie.
jdoe77
Amator
 
Posty: 38
Dołączył(a): 16 mar 2010, o 13:04
Lokalizacja: Wrocław
Medale: 3
Syn (3)
Synology: DS209+II
Firmware: DSM 3.0-1337
Dyski: 2 x 1,5TB WD EARS
Pochodzenie: Wrocław
Internet: 4 MB
Płeć: Mężczyzna
System Operacyjny: W7HP 64
Router/Switch: DIR-635

Re: RAID 1 uszkodzony

Postprzez terrorite » 29 maja 2010, o 12:20

Raczej powienes sie zastanowic czy dysk jest sprawny i z jakiego powodu w ogole takie bledy wystapily. W kazdym razie ja bym podchodzil juz do tego sprzetu nieufnie, przynajmniej do czasu jakiegos solidniejszego przetestowania. Wymienic kable jesli jest tak jak napisal Krwiak i pomonitorowac temperature wewnatrz budy tez mozesz, wyleczyles skutek ale przyczyna to nadal zagadka.
Obrazek
Avatar użytkownika
terrorite
Zawsze On-Line
 
Posty: 447
Dołączył(a): 19 lis 2009, o 16:31
Medale: 9
Syn (2) Wiedza (3)
Linux (1) Zasługi (3)
Synology: DS409
Firmware: 2.3
Dyski: ST31000528AS
Pochodzenie: Warszawa
Internet: 25Mb
Płeć: Mężczyzna

Re: RAID 1 uszkodzony

Postprzez jdoe77 » 29 maja 2010, o 21:42

Z tego co widzę, co czytałem na forum angielskim, oraz z mojego wyczucia, to przyczyną mogą być błędnie sformatowane dyski - powinny używać "Advanced Format" czyli pierwsza partycja zaczyna się na 256 sektorze, a u mnie - na 63. I trochę się dziwię, bo kupując dyski EARS wiedziałem o tym, i specjalnie ściągnąłem najnowsze wersje firmware i Synology Assistant.
Pytanie - czy jest jakiś sposób na "naprawienie" tego bez zgrywania danych oraz reinstalacji firmware? Mam tam dwa dyski - może zmienić RAID 1 w non-RAID, zamontować tylko jeden dysk, drugi sformatować już zgodnie z zaleceniami WD, a następnie przenieść dane na nowo sformatowany dysk, powtórzyć format dla pierwszego dysku i na końcu złożyć z nich RAID?
Z wszystkich form monotonii najgorsze jest potwierdzanie.
jdoe77
Amator
 
Posty: 38
Dołączył(a): 16 mar 2010, o 13:04
Lokalizacja: Wrocław
Medale: 3
Syn (3)
Synology: DS209+II
Firmware: DSM 3.0-1337
Dyski: 2 x 1,5TB WD EARS
Pochodzenie: Wrocław
Internet: 4 MB
Płeć: Mężczyzna
System Operacyjny: W7HP 64
Router/Switch: DIR-635

Re: RAID 1 uszkodzony

Postprzez terrorite » 30 maja 2010, o 12:38

No mozesz tak zrobic, ale jednak bym najwazniejsze dane na wszelki wypadek przeniosl.
Obrazek
Avatar użytkownika
terrorite
Zawsze On-Line
 
Posty: 447
Dołączył(a): 19 lis 2009, o 16:31
Medale: 9
Syn (2) Wiedza (3)
Linux (1) Zasługi (3)
Synology: DS409
Firmware: 2.3
Dyski: ST31000528AS
Pochodzenie: Warszawa
Internet: 25Mb
Płeć: Mężczyzna

Następna strona

Powrót do Pytania

Kto przegląda forum

Użytkownicy przeglądający ten dział: Brak zidentyfikowanych użytkowników i 0 gości