Friday, September 16, 2005

memtest-86: «ΤΡΥΠΑ» στα 791Mb!

Η αλλιώς, πως τον ήπια μέχρι τις αμυγδαλές...

Τις τελευταίες μέρες, το tower pc είχε αρχίσει να κάνει «παλαβιάρικα»: segfaults, στουκαρίσματα κτλ. Τόσα χρόνια στο κουρμπέτι, δεν είχα δει σωστά στημένο linux box να φαίρεται έτσι - πόσο μάλλον που δεν είχα κάνει και κανα update για να πεις ότι τα σκάτωσα με καμιά library... Μπήκαν ψίλοι στα αυτιά μου, μην άρχισε να τα τινάζει το reiser4 στο /usr μετά απο 2 απανοτά black-outs που έκατσαν στο σπίτι.

Ξέρω, ξέρω, extreme experimental fs στο /usr, are you fscking nuts? Δεν μου έδωσε πότε μέχρι τώρα προβλήματα και για κάποιο καιρό κράταγα backup το partition μέχρι να σιγουρευτώ πως δεν θα μου έσκαγε στα μούτρα. Ε, με 4 μήνες 24/7 operation, τι με updates, τι με installs, τι με power losses είχα σιγουρευτεί για το αξιόπιστο και σταμάτησα τα incremental backups, πέταξα και το γιγάντιο tar γιατί ξέμενα από δίσκο και όλα ωραία... μέχρι τις προάλλες, που άρχισαν οι «ομορφιές».

Boot λοιπόν με το custom livecd με kernel nitro και reiser4 support (πάντα έχετε ένα πρόχειρο, είναι αφάνταστα χρήσιμο!) και κάνω fsck. Επιβεβαιώνονται οι φόβοι μου: έβγαλε παπάδες - «και δούλευε έστω έτσι ρε το θηρίο; Μωρέ μπράβο!». Reboot, και τα πράγματα καταντάνε σουρεάλ:
- τι στο διάολο, λες να γαμήθηκε physically ο δίσκος;!!
- μπααα, το S.M.A.R.T. μια χαρά report δίνει... Μάλλον έχασε κανά inode παραπάνω με το fsck και φρικάρουν εντελώς κάποια proggies.
- Ok, reinstall το δίνα πρόγραμμα να στρώσει... Ooops, segfault ο gcc! Εεεεε;!!!
- Ξανά! Ooops, segfault το emerge! Τι έγινε, γαμώ το σπίτι σου, γαμώ;!
- Ξανά! Ok, package emerged correctly! Χμμ... Ρε, λες; Αν είναι έτσι, τον ήπιαμε...

Όποιος έχει δει μια 20άρα bug reports, ξέρει πως σε linux κάτι τέτοια inconsistent segmentation faults, ειδικά σε gcc, δεν ωφείλονται σε κάποια «προσωπικότητα» του pc, ούτε σε μάγια. Εδώ βρωμάει memory corruption...

Reboot ξανά με το livecd και επιλογή για memtest-86: δεν δείχνει πάντα την ζημιά, αλλά τα περισσότερα τα πιάνει και αν είναι έτσι, ζήτω που καήκαμε... Ανάβω τσιγάρο και πριν προλάβω να κάνω το μισό, έχω αρχήσει τις παναγίες και τους χριστούς! Στο 10% το test, έχει πετάξει ίσαμε 16000 errors, ΟΛΑ consistently στα 791Mb, δηλαδή κάπου στα μισά του 2ου memory module (έχω - είχα μάλλον - 2 των 512). Σβήσιμο, πετάω έξω το 2ο module (2 χρόνια νεότερο παρακαλώ από το άλλο!) και ξανά boot με livecd και memtest86. All pass, τουλάχιστον έχω 512Mb ακόμα και δεν θα τρέχω σαν τον παλαβό να πάρω μνήμες...

Reboot. Παραξενιάς συνέχεια... Ωχχχ! Μόλις κατάλαβα τι μαλακία έκανα. Έτρεξα fsck με --rebuild-fs με «τρύπια μνήμη». Κι αν δεν ήταν σώβρακο το partition, σίγουρα τώρα το έχω κάνει. Μετά απο μια σειρά «αυτομουντζώματα» και headbanging στο γραφείο, ακολουθεί απέλπιδα προσπάθεια διάσωσης με κατέβασμα portage snapshot και του τελευταίου stage3 και emerge -pve world. Στα μισά του emerge... BOOM! /usr/bin/python: bad interpreter. Χωρίς βρισίδια, αφού το ένιωθα πως τα chances ήταν πια μηδαμινά, αναφωνώ: Boy, are we fucked now!

Reboot με livecd, ξύλωμα/καθάρισμα partitions και install from scratch. Αυτή την στιγμή κάνει compile το kdebase ενώ εγώ σας γράφω από το laptop...
Τα νεύρα μου, τα χάπια μου κι ένα ταξί να φύγω!!!

Συμπέρασμα 1: Never, EVER, try to fix the software unless you are 100%, positevely sure that the hardware operates correctly. Μ'άρεσει που τα διδάσκω κιόλας ο μαλάκας. «Δάσκαλε που δίδασκες και νόμο δεν εκράτεις...»

Συμπέρασμα 2: Ποτέ, μα ποτέ μην ξαναγοράσεις πράγμα από ναπολετάνικο retail shop. Όλα σκάρτα βγήκανε ρε πούστη μου! Ότι έχω πάρει από ελλάδα, από internet, από προμηθευτές... όλα μια χαρά. Ότι πήρα από εδώ, από διάφορα μαγαζιά, όλα τα πήρε ο διάολος. ΟΛΑ!!! Σκατόγυφτοι, φέρνετε Β διαλογές και τις πουλάτε για χρυσάφι... Αει στο διάολο παλιόπουστες!

7 comments:

Harry said...

Ψυχραιμία φίλε μου... Εγώ την έχω πατήσει τόσες φορές με μνήμη, που οτιδήποτε και να χτυπήσει αρχίζω και πετάω dimms κατευθείαν, σαν ψυχαναγκασμός ένα πράγμα. Ελπίζω να μην έχασες τίποτα σημαντικά δεδομένα μόνο. Καλά configure και make σου εύχομαι!

KiTaSuMbA said...

Thnx Harry!

Ευτυχώς το /home δεν το ακούμπησα αλλά για να είμαι σίγουρος πρέπει πρώτα να στήσω cryptsetup και να ρίξω μια ματιά εκεί μέσα...

(Ναι, ναι, τα personal data τα κρατάω κρυπτογραφημένα...)

Anonymous said...

ευτυχώς δεν είχα ποτέ πρόβλημα με τη μνήμη, πιστεύω ότι θα μου έπαιρνε να καταλάβω ότι είναι αυτό, όχι δεν έχω διαβάσει 20+ bug reports =)
Το cryptsetup το έχεις με password ή data-key? Τι αλγόριθμο κρυπτογράφησης χρησιμοποιείς?

KiTaSuMbA said...

atma:
χρησιμοποιώ passphrase και αλγόριθμο serpent.
Ευτυχώς πάντως δεν έχασα κανένα προσωπικό αρχείο, απλά ξανάστησα την distro και με την ευκαιρία χρησιμοποίησα τα split ebuilds για το kde γλιτώνοντας αρκετή «σαβούρα» (π.χ., τι να το κάνω το kppp όταν είμαι σε LAN;)

Anonymous said...

Κι εγώ Serpent. Είχα ψάξει να βρω κάποιον αλγόριθμο που να ελαχιστοποιεί το overheating για video και audio encrypting/decrypting αλλά δεν βρήκα. Όχι ότι ένας p4 στα 2.6 έχει πρόβλημα αλλά.. έτσι για την καύλα :-) ah btw, Leggi Linux & C, credi che possono spedirmelo in Grecia.. in qualche modo non so?!

KiTaSuMbA said...

Εδώ ο AthlonXP 1800+ με πλέον μόνο 512Mb RAM και δεν δείχνει να κολώνει με το serpent.

Για το Linux&C, στο site τους (oltrelinux.com) δεν φαίνεται να αναφέρουν τίποτα το συγκεκριμένο για τυχόν abbonamenti εξωτερικού. Ωστόσο, αν πληρωθούν, δεν βλέπω τον λόγο αδυναμίας τους να στείλουν τα τεύχη στην ελλάδα. Στείλε ένα e-mail και ρώτα τους πως και αν γίνεται...

Προσωπικά στην ελλάδα διαβάζω το αγγλικό Linux Format, ένα εξίσου καλό περιοδικάκι.

Anonymous said...

Οπως λες και 'συ "κλασικα".
Οτι εχω παρει προβληματικο εχει βγει.
Αγορασα μια καρτα γραφικων Nvidia και ειχε μεσα το cd drivers gia ola ta asxeta(μεχρι και τους drivers της ΑTI)
εκτος απο αυτους που χρειαζονταν.
Χωρια που το cd ηταν αντιγραμμενο(καλα μεσα στο κουτι,κλειστο,αντιγραμμενο cd?).
arrivederci.