Appelez Nos Conseillers au : 02-808 9025

Menu Hide

Enregistrez

Call Me

Lorsque Patterson, Gibson et Katz ont présenté le RAID dans leur publication de 1988, la démonstration a prouvé que le striping d'une série de disques durs PC peu coûteux pouvait surpasser les performances d'un IBM 3380 à 100 000 £.

Ce qu'ils n'ont toutefois pas démontré, c'est la fiabilité : une seule broche défectueuse a provoqué l'effondrement de l'ensemble de la matrice. Les auteurs ont donc orienté les lecteurs vers une méthode de protection qui avait fait ses preuves bien avant l'introduction du terme RAID : mise en miroir du disque

  • Années 1970 : les ordinateurs centraux Tandem NonStop disposaient de deux disques identiques sur des chemins d'E/S séparés, de sorte qu'une seule panne n'interrompait jamais le flux des transactions.
  • 1977 : un brevet IBM (Ken Ouchi) décrit les « copies fantômes » sur deux disques durs identiques afin de garantir l'intégrité des données. 
  • 1983 : DEC HSC50 a livré des sous-systèmes RA8x avec mise en miroir au niveau du contrôleur, le premier produit commercial que nous appellerions aujourd'hui RAID 1.

Les chercheurs de Berkeley ont formalisé cette pratique en tant que niveau 1 dans la nouvelle taxonomie RAID (ou RAID 1) de manière simple et l'ont en plus combinée avec le striping de niveau 0 (ou RAID 0) afin de couvrir à la fois les performances et la disponibilité.

Vous découvrez notre série sur les serveurs et les matrices RAID ?

Commencez par lire notre introduction, « Qu'est-ce que le RAID ? », pour comprendre le striping, la mise en miroir et la parité, les trois concepts sur lesquels reposent tous les niveaux RAID. 

Une fois ces bases acquises, examinons maintenant ce que signifie réellement le terme RAID 1, comment il fonctionne en coulisses et pourquoi il est devenu la solution standard pour les données qui doivent rester en ligne même en cas de panne du disque dur.

Comment fonctionne réellement le RAID 1 : conception, mécanisme et performances 

Contrôleur RAID 1
  1. La réception de la demande d'E/S de l'hôte arrive au contrôleur RAID. Le serveur traite l'ensemble de la matrice comme un seul disque dur logique et commence à écrire.
  2. Le contrôleur duplique chaque opération d'écriture. Chaque bloc (A, B, C... dans le schéma) est vous envoyer aux deux disques du jeu miroir. Cette duplication est transparente pour l'hôte ; aucune modification du pilote ou de l'application n'est nécessaire.
  3. Les deux disques durs peuvent effectuer des opérations de lecture. Pour une demande de lecture, le contrôleur peut sélectionner le membre dont les têtes sont les plus proches, ce qui réduit le temps de recherche et, avec des adaptateurs de bus hôte (HBA) intelligents, double presque le nombre d'opérations d'entrée/sortie par seconde (IOPS) pour les opérations de lecture aléatoire.
  4. En cas de défaillance d'un disque, le contrôleur utilise facilement le disque partenaire qui fonctionne toujours. Comme les données sont déjà entièrement présentes sur ce disque dur, la perte de données est minime par rapport à tous les autres niveaux RAID : pas de calculs de parité, pas de long processus de récupération.
  5. Lorsque le disque défaillant est remplacé (ou qu'un disque de secours est disponible), la personne responsable effectue une opération de clonage séquentiel du disque dur intact vers le nouveau disque dur, après quoi la mise en miroir normale reprend.

Le RAID 1 est donc la configuration canonique de la paire de miroirs : chaque bloc écrit par l'hôte est stocké sur deux disques indépendants, de sorte que deux copies identiques sont disponibles à tout moment. Si l'un des deux disques tombe en panne, le disque restant continue à fournir les données sans interruption. Étant donné qu'un seul des deux miroirs doit rester fonctionnel, la tolérance aux pannes de la matrice est d'un disque par paire. Cependant, la capacité n'est que la moitié de la capacité totale d'origine.

Go utilisables = n×d / 2

où n est le nombre de disques et d leur capacité individuelle. 

RAID 1 : chemin d'écriture et latence

Avec RAID 1, chaque opération d'écriture effectuée par l'hôte est dupliquée. La partie responsable (matériel ou logiciel) émet deux commandes d'E/S et ne confirme la fin de l'opération qu'après que le plus lent des deux disques durs a signalé la réussite. Comme les opérations d'écriture sont effectuées en parallèle, la latence de bout en bout est essentiellement la même que celle d'un seul disque dur ; il n'y a pas de délais de recherche ou de rotation supplémentaires au-delà de ceux déjà présents dans chaque disque.

RAID 1 : Chemin de lecture et débit

Pour les opérations de lecture, le contrôleur RAID 1 peut sélectionner l'un ou l'autre des deux disques durs. 

Les contrôleurs HBA intelligents alternent les requêtes en utilisant une méthode round-robin ou le principe du temps de recherche le plus court afin que les deux têtes puissent fonctionner simultanément. Lorsque cet équilibrage de charge est activé, les IOPS pour les opérations de lecture aléatoire peuvent être presque deux fois plus élevées qu'avec un seul disque. Cependant, les micrologiciels simples ou plus anciens traitent le miroir comme un seul périphérique et n'apportent que peu ou pas d'amélioration des performances.

RAID 1 – Gestion administrative, disques de secours et récupérations

  1. Lorsqu'un disque dur se déconnecte en RAID 1, le volume virtuel reste optimal ; le contrôleur redirige facilement toutes les opérations d'E/S vers le disque qui fonctionne toujours. 
  2. Si une pièce de rechange à chaud (un disque en mode veille prêt à remplacer un disque défaillant) est disponible, elle est automatiquement réclamée et une resynchronisation en arrière-plan copie chaque bloc du membre intact vers le disque de remplacement, sans calcul de parité, simplement comme un clone séquentiel
  3. Le temps de récupération est égal au volume du disque divisé par le taux de transfert soutenu ; pour les disques SATA de 4 To, cela prend quelques heures.

Dans les plus brefs délais, le RAID 1 échange la moitié de votre capacité brute contre la certitude qu'un seul disque ne entraînera jamais de perte de données, tandis que des contrôleurs bien réglés offrent toujours des performances de lecture presque équivalentes à celles du RAID 0.

Cependant, dans les rares cas où les deux disques en miroir tombent en panne ou où le contrôleur RAID est endommagé, Dans ce type de situation, l'intervention de services professionnels de récupération de données RAID peut être indispensable pour récupérer des données stratégiques.

Ensuite, nous comparerons ces avantages et ces coûts à ceux du RAID 0 et des autres niveaux classiques.

Pourquoi les architectes de solutions de stockage choisissent le RAID 1 (et pourquoi ils ne le choisissent pas)

Le seul argument de vente du RAID 1 est clair : la matrice continue de fonctionner même si un disque tombe en panne. Cependant, cette fiabilité se fait au détriment de la capacité et (parfois) de la vitesse d'écriture. Vous trouverez ci-dessous l'équilibre pratique que vous obtenez lorsque vous échangez le RAID 0 avec un striping pur contre une redondance en miroir.

Notez dans le tableau comparatif ci-dessous comment le RAID 1 passe de « aucune étoile » à une note de quatre étoiles pour la tolérance aux pannes, mais chute à 50 % d'utilisation du stockage, soit exactement la moitié de vos téraoctets bruts. 

Niveau RAID Tolérance aux pannes Performances aléatoires Performances séquentielles Utilisation
0 ★☆☆☆ ★★★★☆ ★★★★☆ 100
1 ★★★★ ★★★☆☆ ★★☆☆☆ 5

Avantages nets du RAID 1

  • Disponibilité constante : une seule défaillance ne pose aucun problème ; les utilisateurs ne remarqueront rien.
  • Récupérations prévisibles : la resynchronisation est simplement une copie facile ; 4 To à 200 Mo/s SATA prend environ 6 heures, et non plusieurs jours.
  • Vitesse de lecture : avec un contrôleur intelligent, le taux d'IOPS pour les lectures aléatoires peut être presque le double de celui d'un disque unique, car les deux têtes peuvent traiter chaque demande.

Les compromis inévitables

  • 50 % de votre capacité brute est perdue : les données en miroir sont, par définition, payées deux fois.
  • Les performances d'écriture sont équivalentes à celles du membre le plus lent; chaque validation attend deux disques durs.
  • Le coût par téraoctet protégé est le plus élevé parmi les niveaux standard.
  • Toujours pas de sauvegarde : la corruption, les ransomwares ou les suppressions accidentelles sont immédiatement répliquées ; vous avez toujours besoin de snapshots ou de copies hors site.

Le RAID 1 occupe donc un créneau très spécifique : les ensembles de données de petite à moyenne taille dont la valeur dépasse largement le coût de la capacité brute, et les charges de travail où la vitesse de lecture et la disponibilité continue sont plus importantes que le débit d'écriture.

RAID 1 – Cas d'utilisation et limites

Le RAID 1 est idéal pour toute charge de travail dont la valeur commerciale dépasse largement le coût de la capacité brute et où les temps d'arrêt ne sont pas tolérables. Comme chaque bloc est immédiatement dupliqué, un miroir compense la défaillance d'un disque dur sans interruption et avec une dégradation quasi nulle des performances.

Cas d'utilisation idéaux

  • Volumes de démarrage des systèmes d'exploitation et des hyperviseurs : même une brève panne peut paralyser des dizaines de machines virtuelles ; des fournisseurs tels qu'Oracle recommandent le RAID 1 matériel pour le LUN système sur les serveurs x86 et SPARC. 
  • Journaux de reprise/journalisation de la base de données : la latence est plus importante que la capacité, et les journaux doivent survivre à un crash afin que le moteur puisse continuer à fonctionner correctement.
  • Partages NAS petits mais essentiels : bibliothèques de photos, fichiers bureautiques, machines virtuelles de laboratoire à domicile, etc.
  • Rapports à lecture intensive ou caches Web : les HBA intelligents peuvent traiter des lectures parallèles à partir des deux membres, offrant ainsi des performances IOPS presque doublées sur les lectures aléatoires à partir d'un seul disque tout en maintenant une disponibilité de 99,999 %. 
  • Nœuds NVMe à un seul périphérique : les fournisseurs de cloud recommandent une paire en miroir pour éviter toute SSD pannes  soudaine lorsqu’il n’y a pas de pool de parité.

Scénarios à éviter

  • Archives ou bibliothèques vidéo à l'échelle du pétaoctet : la mise en miroir consomme 50 % de chaque téraoctet ; le codage d'effacement ou les matrices de parité réduisent la surcharge de protection à 20-33 %.
  • Analyses intensives en écriture : chaque écriture logique devient deux écritures physiques, ce qui réduit de moitié les IOPS backend ; le RAID parité ou le RAID 10 offrent un meilleur rapport prix/performance pour les grandes échelles. 
  • Niveaux de stockage à froid où chaque dollar/Go compte : les coûts matériels sont deux fois plus élevés qu'avec le RAID 5/6, mais les exigences de disponibilité sont souvent satisfaites grâce à des répliques en ligne ou des sauvegardes hors site.

Dans les plus brefs délais, le RAID 1 est une assurance pour les ensembles de données de petite à moyenne taille où la perte est inacceptable et où les modèles d'accès sont fortement basés sur la lecture. Lorsque l'efficacité de la capacité ou le débit d'écriture sont primordiaux, la mise en miroir cède la place au RAID 10 imbriqué, aux bandes de parité ou aux codes d'effacement pour le stockage d'objets.

Au-delà de la mise en miroir simple, quelle est la prochaine étape après le RAID 1 ?

Le RAID 1 a résolu le problème de la défaillance d'un seul disque dur, mais les baies plus grandes ont rapidement nécessité plus de bande passante par broche ou une protection contre plusieurs défaillances. Les fournisseurs et les noyaux open source ont donc combiné la mise en miroir avec le striping, puis ont réorganisé les miroirs dans des configurations plus grandes et auto-réparatrices. 

Les miroirs en bandes ou RAID 10 (également appelés RAID 1 + 0) en sont un exemple. Prenez plusieurs paires en miroir et répartissez ces paires. Les opérations de lecture et d'écriture sont réparties de manière équilibrée entre tous les miroirs, de sorte que les performances évoluent de manière presque linéaire avec le nombre de paires, tandis qu'une seule panne de disque dur (et souvent plusieurs, tant que les disques durs concernés se trouvent dans des paires différentes) laisse le volume en ligne.

Les ensembles en miroir, qu'il s'agisse de RAID 1 classique ou de miroirs en bandes (RAID 10), restent inégalés en matière de basculement instantané et de latence prévisible. Cependant, ils consomment la moitié de chaque téraoctet et ne protègent que contre les pannes matérielles. 

La prochaine avancée a consisté à maintenir la vitesse de striping, mais à remplacer les copies de blocs entiers par une parité mathématique, réduisant ainsi la surcharge à 20-33 % et permettant la défaillance de deux disques, voire de nœuds entiers. Cette histoire commence avec RAID 5 et RAID 6. 

Remarque importante

Même avec les paires en miroir du RAID 1, des pannes matérielles imprévues, des pannes simultanées de disques durs ou des dysfonctionnements du contrôleur peuvent sérieusement compromettre vos données. Dans de tels scénarios, Stellar® Récupération de Données propose une récupération professionnelle des données RAID afin de remettre les informations importantes avec le plus haut niveau de certitude et de confidentialité.

76% des personnes ont trouvé ce Base de connaissance commune utile

À propos de l'auteur

Kees Jan Meerman

Kees Jan Meerman

Managing Director, Stellar Data Recovery Europe

  • The Hague Security Delta
  • ISO 9001:2015 Certified
  • MKB Innovative
  • MVO Nederland
Call Me