Tutoriel complet sur smartmontools et les commandes SMART sous Linux

Dernière mise à jour: Mars 4, 2026
Auteur: Isaac
  • smartmontools vous permet de consulter et de tester la technologie SMART des disques et SSD afin d'anticiper les pannes physiques.
  • smartctl est utilisé pour obtenir des informations détaillées, exécuter des tests courts et longs et consulter les journaux d'erreurs SMART.
  • smartd surveille les disques en arrière-plan, planifie des tests périodiques et envoie des alertes en cas de problèmes détectés.
  • La surveillance des attributs clés tels que les secteurs réaffectés ou en attente, ainsi que les sauvegardes, réduisent considérablement le risque de perte de données.

Tutoriel sur la commande smartmontools

Si vous utilisez Linux quotidiennement, tôt ou tard, vous serez confronté à un disque dur défectueux. Et lorsque le Plantages étranges, ralentissements soudains ou erreurs de lectureL'utilisation de Smartmontools fait toute la différence entre préserver vos données et tout perdre. Ce pack inclut les utilitaires nécessaires. smartctl et smartd, capable d'interroger le disque sur son propre état et de vous avertir lorsque quelque chose commence à paraître louche.

Dans cet article, nous examinerons de près le fonctionnement de cette technologie. SMART (technologie d'auto-surveillance, d'analyse et de reporting)Ce guide explique comment installer et configurer SmartMonTools sur différentes distributions, la signification des attributs les plus importants et comment interpréter les tests courts, longs et de transport. L'objectif est de vous permettre d'obtenir… Procédure claire pour la vérification de vos disques, automatisation des alertes avec smartd et prendre des décisions judicieuses quant au moment de continuer à utiliser un disque et au moment de le remplacer, sans trop réfléchir.

Qu’est-ce que SMART et pourquoi devriez-vous vous en soucier ?

La plupart des disques durs mécaniques et SSD modernes intègrent cette technologie en standard. SMART, un système d'autosurveillance interne qui surveille en permanence les paramètres critiques du dispositif : taux d’erreurs de lecture, secteurs réalloués, température, problèmes mécaniques, temps de démarrage, etc. L’objectif est d’offrir une sorte de « thermomètre de santé » du disque pour anticiper les pannes avant qu'elles ne deviennent catastrophiques. Si vous travaillez avec des SSD, il est également conseillé de consulter la documentation. activer ou désactiver la commande TRIM pour maintenir ses performances et sa durée de vie.

SMART stocke en interne une table de attributs numérotésChaque attribut possède une valeur brute (RAW_VALUE) et une valeur normalisée (VALUE, WORST et THRESH). Si la valeur normalisée est inférieure au seuil THRESH, l'attribut est considéré comme défaillant et le disque peut être signalé comme présentant un état global problématique. Il est toutefois important de comprendre que SMART n'est pas infaillible.Des pannes soudaines et imprévisibles peuvent survenir sans avertissement préalable.

Historiquement, les premières normes telles que SFF-8035i et ATA-3/ATA-4 Ils ont défini des tables internes comportant jusqu'à 30 attributs, principalement axés sur la performance et la fiabilité. Avec ATA-4 et ATA-5, les fonctionnalités ont été étendues. journaux d'erreurs et commandes d'autodiagnostic (tests internes courts, étendus, etc.). Bien que la table d'attributs ne fasse plus partie intégrante de la norme, La plupart des fabricants continuent de l'appliquer pour des raisons de compatibilité, afin que smartmontools puisse le lire et le décoder.

Les erreurs que SMART aide à détecter sont, presque toujours, les défaillances prévisibles Lié à l'usure physique du disque : augmentation progressive des erreurs de lecture, secteurs instables, problèmes mécaniques au démarrage, températures hors plage, etc. Il ne peut pas faire de miracles en cas de panne. imprévisible (surtensions, contrôleurs défectueux, chocs violents), mais cela reste l'un des meilleurs outils dont nous disposons pour surveiller la dégradation à long terme d'un disque. En cas de problème après la mise à jour du firmware ou des pilotes NVMe/RAID, consultez la procédure. résoudre les erreurs de stockage.

Point principalUn rapport d'état global SMART indiquant « RÉUSSI » ne garantit pas que le disque ne tombera pas en panne demain, mais un « ÉCHEC » ou une augmentation de certains attributs (secteurs en attente, secteurs hors ligne non corrigibles, réalloués) constitue un avertissement sérieux. Vous devez sauvegarder vos données dès que possible..

Qu'est-ce que smartmontools et qu'est-ce qu'il comprend ?

Commandes smartctl et smartd

El Paquete outils intelligents Il combine deux outils principaux :

  • smartctl: utilitaire en ligne de commande permettant d'interagir directement avec un disque spécifique, de visualiser les attributs SMART, d'exécuter des tests et de consulter les journaux.
  • intelligent: démon qui reste en arrière-plan et qui est chargé de Surveillez périodiquement tous les disques que vous spécifiez, enregistrer les modifications dans les journaux système et envoyer des e-mails ou exécuter des scripts lorsqu'il détecte des problèmes.

Il est disponible pour la quasi-totalité des distributions GNU/Linux modernes (Slackware, Debian, Ubuntu, SuSE, Fedora, RHEL/AlmaLinux/Rocky, Arch, Gentoo, etc.), et possède également versions pour d'autres systèmes comme FreeBSD, macOS (Darwin) ou Solaris. Même sous Windows, il existe des interfaces graphiques telles que… HDDGuardian qui tirent parti de la même logique de lecture des attributs SMART.

En plus de lire et d'afficher des données, smartmontools permet exécuter des autodiagnostics internes du disque (court, long, transport, sélectif), examinez le Journaux d'erreurs ATA/SCSI et des autotests, et même ajuster certains comportements tels que le contrôle de récupération des erreurs ATA (très utile dans disques destinés aux matrices RAIDDans les environnements RAID, il est également conseillé de savoir comment remplacement d'un disque défaillant dans un RAID pour compléter la stratégie de maintenance.

Par défaut, lorsque smartd démarre sur un système Linux standard, Vérifiez les disques toutes les 30 minutesIl tente de détecter tout attribut dont le seuil est dépassé, les messages d'erreur globaux relatifs à l'état du système, l'augmentation des erreurs ATA ou les nouvelles entrées dans le journal de test. Il enregistre toutes ces informations via… SYSLOG (généralement dans /var/log/messages ou /var/log/syslog) Et, si elle est configurée, elle peut également être déclenchée par e-mail ou par des scripts personnalisés.

Installer smartmontools sur différentes distributions

Dans les distributions les plus récentes, smartmontools se trouve dans les dépôts officiels.Cependant, dans les installations minimalistes (par exemple, les images « minimales » d'AlmaLinux, Rocky ou RHEL), il se peut qu'il ne soit pas préinstallé et que vous deviez l'installer manuellement.

Distributions basées sur RHEL : AlmaLinux, Rocky Linux, RHEL

Dans les systèmes modernes basés sur RHEL avec DNFVous pouvez installer le paquet avec :

dnf -y install smartmontools

Dans les dérivés plus anciens qui utilisent encore YUM (y compris certaines anciennes versions d'ALDOS), la commande équivalente serait :

yum -y install smartmontools

Debian, Ubuntu et dérivés

Dans l'univers Debian/Ubuntu et ses variantes comme Linux MintVous pouvez l'installer correctement à partir du gestionnaire de paquets graphique (par exemple, Synaptique) ou depuis le terminal avec :

  Quand je mets la clé et que ça ne démarre pas ?

sudo apt install smartmontools

Après l'installation, vous aurez les deux smartctl comme le diable intelligentSelon la distribution, smartd peut être activé ou désactivé automatiquement jusqu'à ce que vous le configuriez.

Autres distributions : Fedora, Arch, etc.

En Fedora et d'autres systèmes basés sur RPM qui utilisent déjà DNF, l'installation est la même que dans la version actuelle de RHEL. Arch Linux et ses dérivés (Manjaro, EndeavorOS…) s'installe avec:

sudo pacman -S smartmontools

Si vous utilisez une mise en page très spécifique ou une variante minimaliste, vous pouvez toujours... Téléchargez le code source de smartmontools et compilez-le. en suivant les instructions officielles du projet, même si en pratique il est rarement nécessaire d'aller aussi loin.

Activer, démarrer et gérer le service smartd

La surveillance automatique est effectuée par le démon. intelligentUne fois le paquet installé, il est conseillé de l'activer afin que Il démarre avec le système et commence à surveiller vos disques..

Systèmes utilisant Systemd (AlmaLinux, Rocky, RHEL, Debian, Ubuntu récent, etc.)

Pour activer le service au démarrage et le lancer immédiatement :

sudo systemctl enable --now smartd

Si vous modifiez les paramètres de /etc/smartd.confVous devrez redémarrer le service pour appliquer les modifications :

sudo systemctl restart smartd

Et si à un moment donné vous devez l'interrompre (par exemple, pour des tests spécifiques) :

sudo systemctl stop smartd

Systèmes avec SysVinit (environnements hérités comme ALDOS)

Dans les établissements pour anciens combattants encore utilisés sysvinit, les commandes typiques seraient :

Activer dans tous les niveaux d'exécution :

chkconfig smartd on

Démarrez le démon :

service smartd start

Redémarrez-le après les modifications de configuration :

service smartd restart

Arrêtez-le lorsque cela est nécessaire :

service smartd stop

Configurer smartd : fichier /etc/smartd.conf

Le réglage fin du démon est toujours effectué dans /etc/smartd.confLorsque vous l'ouvrez pour la première fois avec votre éditeur préféré (par exemple, vim /etc/smartd.conf), vous verrez quelques exemples de lignes et, très probablement, une directive DEVICESCAN à la fin.

Voici ce qui est généralement typique :

# Sample configuration file for smartd...
DEVICESCAN -H -m root

L'essentiel est de comprendre que DEVICESCAN indique à smartd de rechercher automatiquement tous les disques ATA/SCSI/NVMe. et appliquez les options suivantes (dans l'exemple, -H -m root) à chacune. Si cette ligne est active, Toute configuration ultérieure est ignorée.Si vous souhaitez contrôler précisément ce qui est fait avec chaque périphérique, la pratique courante consiste à commenter cette ligne et à définir des règles spécifiques pour chaque disque.

Options courantes dans les lignes de configuration

Chaque ligne de smartd.conf Elle a généralement cette forme :

/dev/sdX OPCIONES

Où X représente la lettre du disque (a, b, c…) et les options sont de courtes directives indiquant à smartd ce qu'il doit vérifier et comment le signaler. Voici quelques-unes des options les plus couramment utilisées :

  • -a: équivalent à « surveiller pratiquement tout » : attributs SMART, journaux d’erreurs et autotests.
  • -HAfficher uniquement l'état de santé global. Utile pour les alertes simples.
  • -i: comprend des informations d'identification (modèle, numéro de série, micrologiciel).
  • -c: affiche les fonctionnalités SMART prises en charge par l'appareil.
  • -A: imprime les attributs SMART spécifiques au fabricant.
  • -l erreur: ajoute la journalisation des erreurs SMART à ce qui est surveillé.
  • -l autotest: comprend le journal d'autotest.
  • -f: avertit si un attribut « usage » ou « pre-fail » échoue.
  • -m courrier: adresse électronique à laquelle envoyer les notifications.
  • -M type: méthode de notification ; par exemple, -M exec /ruta/script.sh exécuter un script lorsqu'une alarme est déclenchée.
  • -s programmation: planifier l'exécution de tests SMART (hors ligne, courts, longs, transport) à certains jours et heures.
  • -t: combinaison de -p -uAutrement dit, il notifie les changements dans les attributs de pré-défaillance et d'utilisation.
  • -W i,j,k: surveille la température : i correspond à la variation minimale déclenchant une notification, j au seuil d’alerte et k au seuil de défaillance. Pour une surveillance plus détaillée de la température du système, consultez la documentation. configurer les capteurs lm.
  • -Je suis un ID: ignore un attribut spécifique (très couramment utilisé avec 194, température, pour éviter de remplir les journaux toutes les quelques minutes).

Exemples pratiques de lignes dans smartd.conf

Voici quelques scénarios typiques fréquemment rencontrés en production :

1. Surveillance simple des périphériques /dev/sda et /dev/sdb, en examinant l'état général, le journal des erreurs et les autotests, et en surveillant les changements d'attributs, à l'exception de la température :

#DEVICESCAN -H -m root
/dev/sda -H -l error -l selftest -t -I 194
/dev/sdb -H -l error -l selftest -t -I 194

2. Surveillance complète avec contrôle de la température et courrier En cas de problème, tous les attributs sont vérifiés, sauf le 194 ; une alerte est émise si la température augmente ou diminue de 4 °C ou plus, 45 °C est considéré comme un avertissement et 55 °C comme une panne grave.

/dev/sda -a -I 194 -W 4,45,55 -m root@ejemplo.com
/dev/sdb -a -I 194 -W 4,45,55 -m root@ejemplo.com

3. Configuration avancée du serveuren désactivant DEVICESCAN et en programmant des tests périodiques sur un disque spécifique, ainsi qu'en exécutant un script au premier signe de problème :

#DEVICESCAN
/dev/sda -H -l error -l selftest -f -s (O/../../5/11|L/../../5/13|C/../../5/15) -m root@dominio.com -M exec /ruta/al/guion.sh

Dans cet exemple, tous les vendredis Un test court est exécuté à 11h00, un test long à 13h00 et un test de transport à 15h00. En cas d'échec, le script reçoit un rapport complet et peut, par exemple, envoyer plus d'alertes, générer des rapports, ou même arrêter le serveur automatiquement si la situation est critique.

Utilisation manuelle de smartctl : informations, tests et journaux

Bien que SmartD assure une surveillance constante, tôt ou tard, vous souhaiterez… lancer des tests manuels avec smartctl pour observer un élément précis ou confirmer des soupçons. Toutes les actions sont effectuées sur un appareil spécifique, tel que : /dev/sda, /dev/sdb ou un type NVMe /dev/nvme0n1.

Consultez l'assistance SMART et les informations de base

Pour vérifier si un appareil prend en charge SMART et afficher des détails tels que le modèle, le numéro de série et le micrologiciel :

sudo smartctl -i /dev/sda

À la sortie, vous devriez voir des lignes comme celles-ci :

SMART support is: Available - device has SMART capability.
SMART support is: Enabled

S'il apparaît comme désactivé, vous pouvez l'activer avec :

sudo smartctl -s on /dev/sda

Pour consulter les capacités de test prises en charge par le disque (types de tests, durées estimées, etc.) :

  Projecteurs à usage professionnel : un guide complet pour les entreprises

sudo smartctl -c /dev/sda

État sanitaire mondial et rapport détaillé

Pour obtenir un diagnostic rapide, le plus simple est de demander… verdict mondial sur la santé:

sudo smartctl -H /dev/sda

Si tout se passe bien, vous verrez quelque chose comme :

SMART overall-health self-assessment test result: PASSED

Si, au contraire, il apparaît ÉCHEC ou même des messages concernant des attributs qui ont dépassé leur seuil, ce n'est pas le moment de faire preuve de bravoure : Il est temps de procéder immédiatement à une sauvegarde. Et si le disque dur est sous garantie, commencez à penser à une demande de retour de marchandise (RMA).

Pour générer un rapport complet contenant toutes les données SMART, les attributs, les journaux d'erreurs et les autodiagnostics, l'outil idéal est :

sudo smartctl -a /dev/sda | less

Vous pouvez également exporter ces informations dans un fichier texte pour une analyse ou un archivage ultérieur :

sudo smartctl -a /dev/sda > ~/smart_sda.txt

Exécuter des tests : courts, longs et de convoyage

Des autodiagnostics SMART sont exécutés au sein même de l'albumLe système d'exploitation n'a pas besoin d'effectuer d'opération particulière. Vous pouvez même les exécuter avec le système en marche et les partitions montées, bien qu'une légère baisse de performances soit normale pendant le test. Si vous préférez utiliser des outils supplémentaires pour tester les SSD séparément, consultez [lien vers la documentation correspondante]. Outils gratuits pour vérifier la santé de votre SSD.

Les trois tests les plus courants sont :

  1. Test court
    Il vérifie les composants électriques de base, les pièces mécaniques et lit un sous-ensemble de secteurs. Cela prend généralement entre 2 et 5 minutes.
    sudo smartctl --test=short /dev/sda
  2. Test long ou prolongé
    Il effectue un scan virtuel toute la surface du disqueLecture des données et vérification des erreurs. Sur les disques de grande capacité, cela peut prendre des heures.
    sudo smartctl --test=long /dev/sda
  3. Essai de transport (convoyage)
    Conçu pour détecter les dommages physiques causés par les chocs ou les vibrations lors du transport des disques.
    sudo smartctl --test=conveyance /dev/sda

Lorsque vous exécutez l'un de ces tests, smartctl vous indique que le test a commencé, sa durée approximative et l'heure estimée de sa fin. Si vous le souhaitez interrompre un procès en cours:

sudo smartctl -X /dev/sda

Afficher les résultats et les journaux d'erreurs

Les résultats des tests ne sont pas visibles immédiatement après le lancement du test, mais seulement une fois celui-ci terminé. Pour consulter les résultats, veuillez vous référer aux informations ci-dessous. dossier d'auto-évaluation effectué:

sudo smartctl -l selftest /dev/sda

Vous y trouverez un tableau répertoriant les différents tests exécutés, leur statut (terminé avec ou sans erreurs), le pourcentage restant au moment de la détection de l'échec et, le cas échéant, le Première erreur LBA, ce qui indique dans quelle direction logique le problème est apparu.

Pour jeter un coup d'œil à Journal des erreurs SMART (Erreurs ATA/SCSI enregistrées par le disque) :

sudo smartctl -l error /dev/sda

Un journal d'activité vide est généralement bon signe ; quelques entrées très anciennes ne sont pas inquiétantes en soi. Ce qui est effrayant, c'est de voir… Erreurs courantes et récentessurtout si elles coïncident avec des blocages système, des messages d'erreur d'E/S dans dmesg ou des secteurs en attente qui ne se résolvent pas.

Interprétation des attributs clés : par quoi commencer ?

Les rapports complets peuvent être extrêmement longs ; il est donc utile de bien identifier les attributs particulièrement importants pour évaluer la fiabilité d’un disque dur. Parmi les plus critiques figurent :

  • Secteur_Réalloué (ID 5)
    Ce compteur indique le nombre de secteurs défectueux réaffectés à une zone de réserve. Une valeur RAW_VALUE supérieure à 0 indique que des problèmes physiques sont déjà survenus et que le firmware a dû réaffecter des secteurs. Si cette valeur Elle continue de croître au fil du tempsLa dégradation est manifeste.
  • Secteur en attente actuel (ID 197)
    Nombre de secteurs « en attente », c’est-à-dire ceux qui ont entraîné une erreur de lecture et dont la résolution est en attente lors d’une future tentative d’écriture. Toute valeur différente de 0 est un mauvais signe, et si elle ne retombe pas à 0 après un test prolongé (ou une remplissage contrôlé (de ces secteurs), il est temps de sérieusement se méfier de ce bilan.
  • Hors ligne_Non corrigible (ID 198)
    Secteurs défectueux non corrigibles lors des tests hors ligne. Avec une valeur RAW_VALUE de 0, tout est normal ; avec des valeurs élevées, le disque est fortement endommagé.
  • Heures de fonctionnement (ID 9)
    Il indique les heures de fonctionnement du disque. Combiné au temps moyen entre les pannes (MTBF) fourni par le fabricant, il permet d'estimer, à titre indicatif, la durée de vie du disque. probabilité cumulée d'échecCe n'est pas une science exacte, mais cela permet de remettre dans son contexte un disque dur qui fonctionne 24h/24 et 7j/7 depuis de nombreuses années.
  • Nombre de cycles d'alimentation (ID 12)
    Nombre de cycles d'alimentation. Certains disques durs ont des limites de cycles recommandées ; tant que la valeur normalisée VALUE reste comprise entre 100 et 253, tout fonctionne généralement correctement.
  • Température_Celsius (ID 194) ou similaire
    Il enregistre la température actuelle et, parfois, les températures minimales et maximales historiques. Il fonctionne systématiquement au-delà de la plage recommandée par le fabricant. raccourcit la durée de vie du disque notamment.
  • Taux d'erreur du capteur G
    Il mesure les impacts ou les accélérations soudaines qui dépassent le seuil tolérable (fréquents pour les ordinateurs portables qui tombent ou subissent des chocs). Une valeur supérieure à 100 est généralement acceptable ; si elle commence à diminuer, c’est mauvais signe.
  • Taux d'erreur de lecture brute
    Lié aux erreurs de lecture de surface. Son interprétation dépend fortement du fabricant, mais des valeurs brutes anormalement élevées et une valeur en baisse peuvent présager des problèmes graves.

Il faut se rappeler que Le format exact de RAW_VALUE et la signification de certains attributs dépendent du fabricant.Smartmontools intègre une base de données de modèles permettant d'en interpréter automatiquement un grand nombre, et offre également l'option -v Utilisez smartctl pour ajuster manuellement l'interprétation d'attributs spécifiques (par exemple, traiter l'ID 9 comme des minutes au lieu d'heures).

Types de périphériques et option -d

Dans la plupart des cas récents, smartctl détecte automatiquement le type de périphérique avec -d autoNéanmoins, lors de l'utilisation de disques SATA derrière certains ponts USB, contrôleurs RAID ou boîtiers externes exotiques, vous pouvez rencontrer des erreurs telles que « Type de périphérique inconnu » ou des lectures incomplètes.

  Comment fonctionne le goudron ?

Dans ces cas-là, vous pouvez forcer le type de périphérique, par exemple :

  • -données: SATA connecté directement en tant que périphérique ATA.
  • -d assis: SATA derrière un pont (USB-SATA, certains RAID de carte mère, etc.).
  • -d scsi: Disques SCSI/SAS.
  • -d nvme: disques NVMe modernes.

Un exemple typique avec un disque SATA dans un boîtier USB qui ne passe pas la détection automatique serait :

sudo smartctl -a -d sat /dev/sdb

Surveillez automatiquement le disque avec smartd

Lancer smartctl manuellement de temps en temps ne pose pas de problème, mais ce qui est vraiment puissant, c'est de pouvoir le faire. surveillance continue de smartdAinsi, toute modification pertinente est enregistrée et vous pouvez recevoir des alertes avant que le problème ne devienne incontrôlable.

Dans de nombreuses distributions Debian/Ubuntu, en plus de /etc/smartd.conf vous trouverez un fichier /etc/default/smartmontools Vous pouvez y spécifier si smartd doit démarrer automatiquement. Il est généralement préférable de s'assurer que la ligne suivante est affichée :

start_smartd=yes

puis démarrez le service avec :

sudo systemctl start smartd

Si une erreur se produit, vérifiez /var/log/syslog ou /var/log/messages pour voir quelle ligne de configuration pose problème.

En /etc/smartd.conf Vous pouvez utiliser DEVICESCAN avec des options, ou le configurer disque par disque. Un exemple typique pour disques IDE/SATA conventionnels il pourrait être:

/dev/sda -S on -o on -a -I 194 -m admin@dominio.com

Où:

  • -Sont Activez la sauvegarde automatique des attributs SMART.
  • -o sur Activez les tests hors ligne automatiques périodiquement.
  • -a Cela indique que tout doit être surveillé (attributs, journaux d'erreurs, autotests, etc.).
  • -Je 194 Cela lui permet d'ignorer les changements dans l'attribut 194 (température) afin que le journal ne soit pas rempli de messages triviaux.
  • -m Indiquez l'adresse e-mail de destination des alertes.

S'il s'agit d'un disque SATA que le noyau expose comme SCSI (très courant), vous devrez peut-être utiliser l'option -d assis sur la ligne, quelque chose comme :

/dev/sda -d sat -S on -o on -a -I 194 -m admin@dominio.com

La flexibilité de smartd permet également planifier des tests automatisés avec la directive -s, par exemple:

/dev/sda -a -s (S/../.././20|L/../../5/16) -m admin@dominio.com

Cela impliquerait de lancer un test court chaque jour à 20h00 et un test long le vendredi à 16h00, en plus d'envoyer des notifications par e-mail en cas de problème.

Interface graphique : GSmartControl et outils dans d’autres systèmes

Bien que la ligne de commande soit la méthode d'automatisation la plus flexible et la plus attrayante, il est vrai que pour beaucoup, elle n'est pas la plus pratique. Dans ces cas-là, il existe… Contrôle intelligent G, une interface graphique pour smartctl disponible dans de nombreux dépôts GNU/Linux.

Avec GSmartControl, vous pouvez, visuellement, Consultez l'état général de chaque disqueAnalysez les attributs SMART grâce à des indicateurs de risque colorés, exécutez des tests courts et longs en quelques clics et consultez les journaux d'erreurs sans avoir à manipuler des pipes ni des commandes grep. C'est particulièrement pratique pour la gestion des ordinateurs de bureau ou pour vérifier rapidement la baie de disques d'une machine sans passer par le terminal. De plus, vous pouvez utiliser des outils comme [noms d'outils manquants] pour comparer et surveiller les disques. CrystalDiskInfo dans les environnements Windows.

Dans les environnements Windows, il existe des applications telles que HDDGuardian qui jouent un rôle similaire, s'appuyant également sur la lecture des attributs SMART et l'exécution de tests internes.

Que faire en cas de problèmes non résolus ou d'erreurs graves ?

Un cas très typique : le système commence à ralentir, il y a des plantages sporadiques, vous vérifiez /var/log/messages o /var/log/syslog et vous voyez des lignes répétées de smartd comme ceci :

Device: /dev/sda, 2 Currently unreadable (pending) sectors
Device: /dev/sda, 2 Offline uncorrectable sectors

Vous remarquerez peut-être aussi que le La température monte et descendet les attributs apparaissent Current_Pending_Sector > 0 et Offline_Uncorrectable > 0À ce stade, la chose raisonnable à faire est :

  1. Sauvegarder les données importantes immédiatement, avant de toucher quoi que ce soit d'autre.
  2. Commencez, si possible, par un disque de secours ou une clé USB en mode Live pour éviter de trop solliciter le disque concerné.
  3. Exécutez un Essai long SMART sur le disque afin que le firmware puisse tenter de lire et, si possible, de réaffecter ces secteurs problématiques :
    sudo smartctl -t long /dev/sda
  4. Attendez le temps indiqué par smartctl, redémarrez si nécessaire et consultez les journaux d'autotest et d'erreurs.

Le test étendu oblige le disque à tenter de lire et, dans certains cas, d'écrire sur les secteurs problématiques. S'il parvient à les réaffecter, Le compteur des secteurs en attente devrait diminuer.Bien que le nombre de tâches réaffectées augmente, si les tâches en attente ne disparaissent pas ou continuent d'augmenter au fil du temps, il est clair que le disque est saturé. à la fin de sa durée de vie utile et il devrait être remplacé dès que possible.

Dans de nombreux cas, si le disque dur est encore sous garantie, les outils de diagnostic officiels du constructeur (PowerMax, Drive Fitness Test, etc.) reposent sur les mêmes principes et, s'ils détectent des erreurs de ce type, ils génèrent généralement un code d'erreur que vous pouvez utiliser pour demander un remplacement. Si vous utilisez un NAS en RAID-1, consultez la procédure suivante : Remplacement d'un disque dans un NAS avec RAID-1.

En fin de compte, la règle d'or est simple : si SMART commence à briller, surtout avec des attributs de secteurs en attente, hors ligne non corrigibles ou réaffectés en hausseIl vaut mieux ne pas jouer avec le feu. Sauvegardes, clonage si nécessaire et nouveau disque dur.

L'utilisation de smartmontools vous offre un avantage considérable par rapport à une approche « à l'aveugle » : vous pouvez Surveillez l'état de vos disques durs avec une précision considérablePlanifiez des tests réguliers et configurez un système d'alertes par e-mail ou des scripts pour être averti en cas de problème. Cela ne remplace pas les sauvegardes (jamais), mais cela vous aide à anticiper les catastrophes Vous pouvez désormais décider, données à l'appui, si un disque est encore acceptable pour un usage donné et quand il est temps de le mettre au rebut avant qu'il ne vous laisse en panne au pire moment.

Utilisation de fstrim sous Linux
Article connexe:
Utilisation de fstrim sous Linux pour optimiser les SSD