• zpool logfiles?

    From Kai Richter@2:240/77 to Alle on Tue Jun 6 18:14:52 2023
    Moin Leute!

    Ich habe gerade noch eine neue Jail anlegen wollen und dabei den Hinweis auf degraded pool gesehen. Nachdem mir zpool status eine Platte als REMOVED angezeigt hat und ich die erste Panikattacke mit einem Streifen Schokolade abgewehrt hatte, ging ich auf die Fehlersuche. Die Platte war da und erreichbar, gpart status hat fehlerfrei die Partitionstabelle geliefert und auf zpool status waren auch keine Errors angezeigt. Ich habe die Platte jetzt mit zpool online zurück geholt, sie liess sich ins resilvering rufen.

    Ich habe mit zpool history in das Pool Log geschaut, aber keine Hinweise auf den Fehlerzeitpunkt gefunden. Der Pool steht seit 2018-11.

    2020-10 upgrade
    2021-08 zpool online -e
    2023-06 etwa 15min nach zpool online: scan done errors=0

    Das einzige "offline" in der History war 4 Tage nach Einrichtung und gewollt. Der Pool besteht aus Platten verschiedener Bj, die betroffene ist nicht die älteste und aus 3Q 2020.

    Ich habe die root mailbox gefunden, hüstel, in den 21 MB finde ich kein "offline", kein "online" und bei "grade" nur python upgrade Hinweise.

    Wo kann ich sehen wann die Platte offline gegangen ist?

    Edit: Hm, geht ja um Platte, nicht unbedingt um zpool. Da würde der Kernel das geom platt machen? Platte hängt an ada1,... Ups.
    Gefunden. In dmesg.today vom 25.05. in der Nacht:

    ada1 at ahcich1 bus 0 scbus1 target 0 lun 0
    ada1: <WDC WD80EFAX-68LHPN0 83.H0A83> s/n 22 detached
    (ada1:ahcich1:0:0:0): Periph destroyed
    ada1 at ahcich1 bus 0 scbus1 target 0 lun 0
    ada1: <WDC WD80EFAX-68LHPN0 83.H0A83> ACS-2 ATA SATA 3.x device
    ada1: Serial Number 22
    ada1: 600.000MB/s transfers (SATA 3.x, UDMA6, PIO 8192bytes)
    ada1: Command Queueing enabled
    ada1: 7630885MB (15628053168 512 byte sectors)

    Hat sich die Platte da mal kurz verabschiedet?

    Tschuess

    Kai

    --- GoldED+/LNX 1.1.4.7
    * Origin: Es gibt nichts, was es nicht gibt. (2:240/77)
  • From Gerhard Strangar@2:240/2188.575 to Kai Richter on Wed Jun 7 16:36:58 2023
    Am 06 Jun 23 18:14:52 schrob Kai Richter an Alle zum Thema
    <zpool logfiles?>

    ada1: <WDC WD80EFAX-68LHPN0 83.H0A83> s/n 22 detached
    [...]
    Hat sich die Platte da mal kurz verabschiedet?

    ... oder das Kabel oder der Controller.



    Tschoe mit Oe
    Gerhard
    ---
    * Origin: (2:240/2188.575)
  • From Gerrit Kuehn@2:240/12 to Kai Richter on Wed Jun 7 18:54:20 2023
    Hello Kai!

    06 Jun 23 18:14, Kai Richter wrote to Alle:


    Hat sich die Platte da mal kurz verabschiedet?

    Sieht so aus. Hast Du da vielleicht gerade am Kabel gewackelt oder lustige Dinge mit camcontrol gemacht? Was sagt smartctl zu der Platte?


    Regards,
    Gerrit

    ... 6:54PM up 442 days, 41 secs, 7 users, load averages: 1.39, 0.77, 0.60

    --- msged/fbsd 6.3 2021-12-02
    * Origin: America, America the western dream is gone (2:240/12)
  • From Kai Richter@2:240/77 to Gerrit Kuehn on Tue Jun 13 07:56:20 2023
    Tach auch Gerrit!

    Am 07 Jun 23, Gerrit Kuehn schrieb an Kai Richter:

    Hat sich die Platte da mal kurz verabschiedet?

    Sieht so aus. Hast Du da vielleicht gerade am Kabel gewackelt oder
    lustige Dinge mit camcontrol gemacht?

    Laut Kalender war ich nicht da.

    Was sagt smartctl zu der Platte?

    Raw error count, crc error, realloc sector, pending sector, seek error, alles bei Null.

    Durchschnitt Temp 53°C. Bei max limit 60°C, aktuell 59°C. Wird wohl Zeit für die jährliche Lüfterreinigung.

    Einzig auffällig ist:

    0x06 0x008 4 2 --- Number of Hardware Resets
    0x06 0x010 4 3 --- Number of ASR Events
    0x06 0x018 4 0 --- Number of Interface CRC Errors

    Bisher ist die Platte wieder durchgehend online. Ich denke ich werde es nur unter Beobachtung halten.

    Tschuess

    Kai

    --- GoldED+/LNX 1.1.4.7
    * Origin: Sag mir wo die Blumen sind, wo sind sie geblieben... (2:240/77)
  • From Gerrit Kuehn@2:240/12 to Kai Richter on Tue Jun 13 20:55:00 2023
    Hello Kai!

    13 Jun 23 07:56, Kai Richter wrote to Gerrit Kuehn:


    Was sagt smartctl zu der Platte?

    Durchschnitt Temp 53°C. Bei max limit 60°C, aktuell 59°C. Wird wohl
    Zeit für die jährliche Lüfterreinigung.

    Allerdings, das ist zu warm. Die Dinger mörgen wirklich nicht mehr. Ich habe schon erlebt, daß die mehr oder weniger bei Strich 60 Grad Busfehler werfen und aussteigen.

    Bisher ist die Platte wieder durchgehend online. Ich denke ich werde
    es nur unter Beobachtung halten.

    Viel Erfolg.


    Regards,
    Gerrit

    ... 8:55PM up 448 days, 2:01, 7 users, load averages: 0.36, 0.52, 0.57

    --- msged/fbsd 6.3 2021-12-02
    * Origin: And still they come and go (2:240/12)