Table des matières
La durée de vie des disques dur à état solide (SSD) est mieux perçue à travers deux lentilles complémentaires.
- Les mesures d'endurance telles que le TBW (Terabytes Written) décrivent la fréquence à laquelle les cellules de la mémoire NAND peuvent être effacées et reprogrammées.
- Le temps moyen entre les défaillances (MTBF) et son dérivé, le taux de défaillance annualisé (AFR), indiquent en revanche la probabilité que les composants électroniques du SSD, tels que les contrôleurs, les circuits d'alimentation et les microprogrammes, subissent une défaillance aléatoire.
Les chiffres MTBF/AFR sont calculés à l'aide de modèles de fiabilité des composants ; ils sont largement indépendants du TBW. Dans la pratique, cependant, ils deviennent critiques lorsqu'un disque fait l'objet de nombreuses écritures ou est utilisé à chaud (car l'intensité des E/S et la température accélèrent l'usure électronique et la fatigue des joints de soudure).
Quelle est la durée de vie des disques SSD ?
Pour les disques durs magnétiques, il existe déjà des recherches approfondies sur les défaillances des disques durs (voir notre article sur les symptômes des défaillances des disques durs). Cependant, les disques SSD deviennent rapidement le choix standard, tant pour les particuliers que pour les entreprises.
L'une des raisons est leur longévité. Le MTBF des disques SSD est généralement de 1,5 million d'heures, contre 250 000 heures pour un disque dur classique. En outre, dans le monde réel, les disques SSD peuvent facilement avoir une durée de vie de 5 à 10 ans, contre 3 à 5 ans pour les disques durs.
Les disques SSD sont actuellement plus chers que les disques durs. Toutefois, les analystes du secteur qui utilisent les courbes de coût de la loi de Wright prévoient que le coût par To de la flash NAND passera en dessous de celui des disques durs dès 2026.
Bien que cette prévision puisse sembler ambitieuse, il est très probable que les disques SSD supplanteront les disques durs dans quelques années. Il est donc essentiel de reconnaître les signes d'attention d'une défaillance des SSD et de savoir comment vérifier leur état de santé avant que cette transition ne soit achevée.
Les principaux fabricants de disques SSD aident les utilisateurs en divulguant des compteurs de santé détaillés via les pages S.M.A.R.T. et NVMe. Toutefois, les données du fabricant ne peuvent pas couvrir à elles seules tous les modes d'erreur.
Deux études de terrain à grande échelle ont livré de nombreuses conclusions sur les échecs de la DSS à l'attention du public :
- Enquête sur plus d'un demi-million de disques SSD pendant trois ans dans un centre de données de Microsoft.
- Une analyse de 30 000 disques sur six ans dans un centre de données de Google.
Ce disque fait la synthèse de ces résultats publics et des conseils des fabricants afin de vous fournir une liste de contrôle concise, basée sur des données, qui vous aidera à repérer les premiers signes - souvent très subtils - d'une défaillance imminente du disque SSD.
Comment reconnaître les signes d'une défaillance du disque SSD ?
Les disques à état solide sont considérés comme plus fiables que les disques durs classiques, car ils ne comportent pas de pièces mobiles. Cependant, ils présentent leurs propres risques de défaillance, qui sont principalement liés à la durée de vie limitée des cellules de mémoire flash, à la stabilité du contrôleur et à l'intégrité du microprogramme.
Lorsque les disques SSD tombent en panne, les symptômes peuvent être discrets au début, mais ils peuvent rapidement s'aggraver.
n°1. des performances lentes, en particulier lors des opérations d'écriture
Si vous constatez une baisse sensible des performances de votre disque SSD, cela peut être le signe d'une défaillance imminente. Ce type de ralentissement se produit parce que les cellules de mémoire flash du disque SSD commencent à s'user après un certain nombre d'opérations de lecture et d'écriture.
Au fur et à mesure que les cellules se détériorent, le contrôleur du disque SSD doit travailler plus dur pour gérer les données. Il peut répéter des écritures qui ont échoué et passer beaucoup de temps à redistribuer les données des cellules défectueuses vers les cellules libres.
Pour l'utilisateur, cela se traduit par un ralentissement de la vitesse de lecture/écriture du disque SSD. Ce ralentissement est perceptible lorsque vous essayez d'enregistrer des fichiers volumineux, d'installer un nouveau logiciel ou même, parfois, lorsque vous démarrez le système et que cela prend plus de temps que d'habitude.
2. fichiers et dossiers endommagés ou inaccessibles
Si vous avez constaté que des fichiers qui pouvaient auparavant être ouverts sans problème ne sont soudainement plus lisibles ou sont perdus, cela peut être le signe d'une défaillance imminente du disque dur SSD. Ce phénomène est dû à des erreurs de mémoire, les données stockées dans des cellules flash vieillissantes pouvant se dégrader avec le temps. Le code de correction d'erreur (ECC) peut gérer des erreurs mineures, mais si les erreurs dépassent la capacité de l'ECC à les corriger, les données deviennent corrompues ou illisibles.
3. passage soudain au mode lecture seule
Dans certains cas, le micrologiciel d'un disque SSD marque le pool de blocs de réserve comme étant épuisé ou détecte un comportement P/E dangereux et bloque donc les opérations d'écriture ultérieures. Cela signifie que vous pouvez visualiser les fichiers et y accéder, mais que vous ne pouvez pas enregistrer de nouveaux fichiers ou apporter des modifications à vos données.
Le mode lecture seule est une mesure de protection déclenchée par le micrologiciel du SSD lorsqu'il détecte que le disque n'a plus la certitude d'écrire. Cela signifie également que vous êtes exposé au risque de perte de données. Dans un tel cas, il est préférable de contacter un service de récupération de donnéesprofessionnel.
4. le disque disparaît ou n'est pas reconnu
Si votre disque SSD disparaît complètement et n'apparaît plus dans le BIOS, cela indique une erreur critique dans le contrôleur ou dans le micrologiciel du disque. Dans ce cas, vous devez contacter un expert en récupération de données pour déterminer si vos données sont en danger ou non.
5. Alertes SMART (pour les utilisateurs qui surveillent)
Les disques SSD signalent également leur état via les attributs SMART (Self-Monitoring, Analysis, and Reporting Technology). Les attentions relatives aux secteurs réalloués, aux erreurs de programmation/suppression, aux erreurs non corrigibles ou aux indicateurs d'usure générale doivent être prises au sérieux et ne doivent pas être ignorées.
Vous trouverez ici un aperçu des principaux attributs SMART, de leur signification et de l'importance de leur valeur.
ID de l'attribut | Nom | Description de la | Pourquoi c'est important | Seuil de préoccupation immédiate |
202 / 169 | Pourcentage de la durée de vie restante/utilisée | Suivi de l'usure des disques SSD en fonction des cycles de programmation/effacement et des blocs de remplacement | Lorsque cette valeur atteint 0 % (ou 100 %), le disque a atteint la fin de sa durée de vie et peut être protégé en écriture. | < 5 % restants ou > 95 % consommés |
05 | Nombre de blocs NAND nouvellement alloués | Nombre de blocs flash qui ont été réalloués en raison d'une erreur | Des valeurs croissantes indiquent une usure ou un endommagement de la foudre | > 100 au total ou > 10 nouveaux (en une semaine) |
180 / 181 | Nombre d'erreurs non corrigibles / nombre d'erreurs de programme | Nombre d'erreurs qui n'ont pas pu être corrigées par le CEC | Indique le risque de perte de données | ≥ 1 (chaque occurrence) |
232 / 233 | Indicateur d'usure du support | Mesure l'usure totale des cellules NAND | L'approche de la valeur seuil signale la fin de la durée de vie. | chute en dessous de la limite spécifiée par le fabricant (souvent 10 ou 5) |
194 | Température | Température actuelle de l'appareil | La surchauffe réduit la durée de vie des disques SSD | > 70 °C ou un saut > 15 °C |
12 | Nombre de cycles énergétiques | Nombre de fois où le SSD a été mis en marche | Des valeurs élevées peuvent indiquer une instabilité ou une utilisation excessive | > 5 000 en association avec d'autres symptômes |
Attention critique | Résumé de l'attention critique | Indique chaque condition dans laquelle une valeur seuil est dépassée (par exemple, température, blocs de réserve, erreur de support). | Une attention immédiate est requise en cas d'apparition d'un problème de santé publique. | Chaque bit non nul |
Outils de détection précoce des défaillances du disque dur / Comment vérifier l'état du disque dur ?
- Outils de surveillance SMART : Ces utilitaires lisent les attributs SMART de la plupart des disques SSD modernes. Des outils tels que CrystalDiskInfo (interface graphique Windows) peuvent récupérer les attributs spécifiques au fabricant, décoder la température, l'usure et les compteurs d'erreurs.
- Outils au niveau du système d'exploitation : Les pilotes du noyau ou de la classe de mémoire écrivent les délais, les tentatives de CRC et les tempêtes de réinitialisation de liaison dans les journaux du système (par exemple, Windows Event ID 153). L'enlèvement continu des journaux complète les données SMART, car certaines défaillances soudaines du contrôleur ne se manifestent que par des erreurs de bus avant que le disque ne disparaisse.
- Logiciel de diagnostic des disques : Des applications telles que GSmartControl et HDDScan appellent des autotests intégrés de court-circuit, d'expansion et de transfert et peuvent effectuer des balayages de surface qui signalent les blocs flash faibles bien avant que le micrologiciel n'épuise ses réserves.
- Utilitaires du fabricant : Samsung Magician, Western Digital Dashboard, Crucial Storage Executive et autres programmes similaires affichent des indicateurs d'usure propriétaires, appliquent des mises à jour de microprogrammes et déclenchent des routines de nettoyage de sécurité ou d'autotest auxquelles les outils génériques n'ont pas accès.
Que faire si vous constatez une défaillance imminente du disque SSD ?
La détection précoce d'une défaillance imminente d'un disque SSD peut éviter une crise. Un contrôle vigilant, des mises à jour du micrologiciel et un contrôle de la température peuvent prévenir la plupart des défaillances, mais l'électronique peut toujours tomber en panne sans attention.
Si vous vous rendez compte que vous avez perdu vos données sur un SSD, agissez immédiatement : lancez le logiciel Stellar® Récupération de Données pour analyser gratuitement le SSD concerné. Cet outil puissant signale tous les fichiers récupérables avant que vous n'achetiez une licence, ce qui vous permet de décider si vous souhaitez ou non investir dans le programme.
Si le disque est physiquement endommagé ou complètement illisible, ou si vous pensez que le SSD va tomber en panne, contactez les services de Stellar® Récupération de Données SSD pour une consultation gratuite. Nos ingénieurs et techniciens en récupération de données SSD ont une connaissance approfondie des structures de stockage SSD et maîtrisent les compétences requises pour récupérer les données des disques SSD morts ou endommagés.