Friday, October 9, 2009

WD 10K RPM SATA Velociraptor problem, czyli czemu ten dysk nie nadaje się na RAID

Okazuje się, że jest problem z firmware'm raptorów. Po ciągłym przepracowaniu 49 dni 17 godzin i 2 minut, wewnętrzny licznik czasu się zeruje się po dojściu do końca zakresu (chodzi o zerowanie tego typu 9999->0000) wyrzucając przy okazji zerowania wszystkie aktywne komendy zapisu/odczytu/kasowania z błędami TLER. Jeśli wolumen RAID zbudowano na samych Raptorach, kontroler RAID zrzuca natychmiastowo cały wolumen, ponieważ wszystkie dyski zgłaszają TLER w tym samym czasie.
Teraz będzie najlepsze: WD zaleca kompletne wyłączenie zasilania dysków co 30-40 dni, tak by wcześniej zresetować wewnętrzny licznik czasu, ponieważ zwykły reset czy restart nie resetują tego licznika. Oczywiście dostępny już jest update firmware'u do tych dysków.
Szczegóły całej sprawy dostępne są --> tutaj.

Muszę przyznać wtopa na całego, choć i tak lepiej niż słynne wpadki Seagate'a z nagłą śmiercią dysków w czasie bootowania się komputera, czy poprawionym firmware'm, który zabijał dyski.
Ubawiły mnie natomiast 2 komentarze do całej sprawy, pierwszy : Nice. Enterprise drives my ass, i drugi: it's too late for one of my drives - may it rest in peace or pieces...

A tak już na spokojnie, to chyba najlepiej pociągnąć smartmontools i dla własnego spokoju wrzucić z konsoli smartctl -a /dev/sda.

No comments: