Appelez Nos Conseillers au : 02-808 9025

Menu Hide

Enregistrez

Call Me

Dans leur article « A Cas for Redundant Arrays of Inexpensive Disks (RAID) », présenté lors de la conférence SIGMOD en 1988, David Patterson, Garth Gibson et Randy Katz ont présenté une hypothèse intéressante : le RAID 0. En répartissant facilement les données sur des disques durs PC peu coûteux sans redondance, ils ont démontré qu'il était possible de multiplier le débit et la capacité d'E/S à moindre coût, à condition d'accepter le risque de tout perdre en cas de panne d'un disque.

Qu'est-ce que le RAID 0 ?

Le RAID 0, également appelé « striping », est la configuration de matrice la plus simple. Il s'agit d'un RAID, mais sans redondance. Deux disques physiques ou plus sont traités comme un seul volume logique, et chaque fichier est divisé en morceaux ou bandes de taille égale. Ces bandes sont écrites sur les disques dans un ordre circulaire, de sorte que tous les axes (ou canaux dans le cas des SSD) fonctionnent en parallèle.

RAID 0 - Récupération de données Stellar

Comme aucune copie supplémentaire ni aucun code de parité n'est stocké, le RAID 0 offre trois caractéristiques clés :

  • Vitesse : la bande passante séquentielle et les IOPS (opérations d'entrée/sortie par seconde) évoluent de manière presque linéaire avec le nombre de disques.
  • Capacité totale : vous conservez 100 % de l'espace total du disque, sans surcoût.
  • Aucune tolérance aux pannes : si un membre tombe en panne, le jeu de bandes s'effondre et vous aurez besoin d'une aide professionnelle pour récupérer les données de la configuration RAID 0

Ce compromis rend le RAID 0 attrayant pour les charges de travail non critiques (rendu à partir de zéro, tampons de capture à grande vitesse, équipements de jeu pour passionnés) où les performances brutes sont plus importantes que la durabilité.

RAID 0

RAID 0 dans une matrice où les données sont réparties sur cinq disques durs

Comment fonctionnent le RAID 0 ou le striping ?

1. Logique du striping

Le contrôleur RAID (ou le logiciel du système d'exploitation) sélectionne une taille de bloc, par exemple 64 Ko. Il divise les opérations d'écriture entrantes en blocs et les attribue séquentiellement aux disques durs : le bloc 0 au disque dur 0, le bloc 1 au disque dur 1, le bloc 2 au disque dur 2, et ainsi de suite, en recommençant lorsqu'il atteint le dernier disque.

2. Composition du striping

Un groupe de blocs ayant le même décalage logique forme une bande. Dans une matrice à quatre disques durs, la première bande créée pourrait contenir les blocs 0 à 3 (c'est-à-dire un bloc par disque dur). Des tailles de blocs plus importantes, par exemple deux blocs par disque dur, donnent des bandes plus larges, ce qui favorise les transferts séquentiels volumineux ; des blocs plus petits améliorent le parallélisme dans les opérations d'E/S mixtes.

3. Comportement en lecture/écriture

Pour les opérations d'E/S séquentielles, le contrôleur envoie simultanément des commandes à tous les disques de la bande, en utilisant la bande passante de tous les axes à la fois. Les opérations d'E/S aléatoires sont réparties de manière à ce qu'aucun disque ne devienne un point chaud. 

La latence pour une seule opération de lecture de 4 Ko est à peu près équivalente à celle d'un seul disque, mais le débit global atteint N × S pour les charges de travail séquentielles et N × R pour les charges de travail aléatoires (où N est le nombre de disques, S est la vitesse de lecture séquentielle en Mo/s et R est la vitesse de lecture aléatoire en Mo/s).

4. Sémantique des pannes

Sans parité ni mise en miroir, la matrice n'a aucun moyen de reconstruire les blocs perdus ; un disque dur défaillant peut invalider tous les fichiers.

Exemple concret de RAID 0

Considérons cette phrase comme un bloc de données : « RAID_0_est_vraiment,_vraiment_rapide ».

Répartissons cette phrase de six mots avec une taille de bloc de quatre caractères sur quatre disques durs.

Comment fonctionne le striping - Stellar

1. Chemin d'écriture

Le mot 1 (« RAID ») se retrouve sur le disque dur 0.

Le mot 2 (« _0_g ») visite le disque dur 1, le mot 3 (« oes_ ») visite le disque dur 2 et le mot 4 (« real ») visite le disque dur 3.

La personne responsable commence ensuite avec la deuxième bande : « ly,_ » → disque dur 0, « real » → disque dur 1, « ly_f » → disque dur 2 et « ast. » → disque dur 3. 

2. Chemin de lecture

La lecture séquentielle du registre est effectuée simultanément par quatre disques, chacun fournissant sa partie tandis que les autres passent au bloc suivant, ce qui permet d'obtenir environ quatre fois la bande passante d'un seul disque.\

3. Scénario de défaillance

Si le disque dur 2 tombe en panne, les parties « oes_ » et « ly_f » sont perdues, ce qui endommage les deux bandes et rend l'ensemble illisible. C'est le compromis du RAID 0 : une vitesse fulgurante, mais aucune tolérance en cas de panne d'un disque dur.

RAID 0 – Avantages et limites

Le RAID 0 est un striping simple sans redondance. C'est la base sur laquelle Patterson, Gibson et Katz ont modélisé cinq configurations RAID différentes dans leur publication de 1988.

  • « 75 disques durs à faible coût ont potentiellement 12 fois la bande passante d'E/S de l'IBM 3380 et la même capacité avec une consommation d'énergie et un coût moindres. »
Caractéristique Importance dans la pratique
Performances Bande passante séquentielle ≈ W × (bande passante d'un seul disque) ; les IOPS évoluent de manière similaire jusqu'à saturation de la file d'attente du contrôleur ou des voies PCIe. 
Capacité Somme de tous les disques membres ; aucune surcharge.
Fiabilité Temps moyen avant perte de données (MTTDL) ≈ MTBF / W : chaque disque supplémentaire réduit le temps moyen avant perte catastrophique. Un RAID 0 avec 20 disques peut présenter une probabilité de défaillance ≥ 50 % en cinq ans, même avec des disques SAS de classe entreprise. 
Récupération Aucune – il n'y a rien à récupérer. Les sauvegardes ou la réplication de niveau supérieur sont obligatoires.

Scénarios de déploiement – où le RAID 0 est approprié

Le RAID 0 convient aux scénarios où la vitesse pure et la capacité totale sont plus importantes que la tolérance aux pannes. Le tableau suivant répertorie ces scénarios et explique pourquoi le RAID 0 est efficace dans ces cas.

Scénario Pourquoi le RAID 0 est-il intéressant ?
Production de vidéos ou d'images à haut débit binaire Les opérations de lecture/écriture séquentielles massives sollicitent fortement les disques durs individuels ; le striping agrège la bande passante pour des timelines 4K/8K fluides et des effets en temps réel.
Caches de travail ou de rendu dans les effets visuels/calculs scientifiques Les ensembles de données peuvent être facilement régénérés, de sorte que la perte d'un volume coûte du temps, mais pas d'informations irremplaçables. Le striping parallèle élimine les goulots d'étranglement d'E/S de rendu.
Tampons d'acquisition à haute vitesse (instruments de laboratoire, séquences vidéo) Les zones de visite à court terme nécessitent des écritures en rafale ; après la capture, les fichiers sont déplacés vers un stockage protégé.
Plateformes de jeux ou de benchmark pour les passionnés Les tests synthétiques et les écrans de chargement ont des taux de transfert plus élevés ; le risque est acceptable car les images du système d'exploitation/du jeu peuvent être facilement réinstallées.
Environnements de construction ou de test temporaires Les pipelines d'intégration continue compilent des artefacts qui sont recréés à chaque exécution, la vitesse de compilation primant sur la persistance.

Scénarios de déploiement – où le RAID 0 doit être évité

Malgré l'attrait de la vitesse, le RAID 0 est le pire choix pour toutes les charges de travail qui ne tolèrent pas la perte de données ou les longs délais de récupération. Veuillez considérer ces cas d'utilisation.

  • Bases de données et systèmes transactionnels critiques pour l'entreprise : la défaillance d'un seul disque dur détruit toutes les tables ; à la place, les matrices en miroir (RAID 1/10) ou à parité sont la norme. 
  • Partages de fichiers d'entreprise, supports d'archivage ou jeux de sauvegarde nearline : la capacité est importante, les données sont uniques et les fenêtres de récupération doivent être prévisibles. À la place, le RAID 5/6 ou le codage d'effacement offrent une protection avec beaucoup moins de risques. 
  • Charges de travail avec des opérations d'E/S aléatoires mixtes qui ne peuvent pas être interrompues pour la récupération des données : les performances sont faibles, mais la récupération des données après une panne nécessite de remettre entièrement la sauvegarde. 
  • Tout environnement sans stratégie de sauvegarde automatisée et robuste : le striping multiplie le risque de perte de volume : n disques → n fois la probabilité de panne. Un RAID 0 avec deux disques durs double déjà le risque. 

Le RAID 0 offre de la vitesse au détriment de la sécurité. Ne l'utilisez que si la charge de travail est dispensable ou protégée d'une autre manière ; sinon, choisissez un niveau RAID (ou un niveau de Cloud) qui répond à vos exigences en matière de durabilité.

Le RAID 0 présente donc deux facettes : il a prouvé les performances du RAID et rappelé à tous les architectes de stockage que la vitesse sans durabilité ne fonctionne que pour les données non indispensables.

Au-delà du RAID 0

Le RAID 0 a prouvé que le striping pouvait offrir des gains de vitesse considérables, mais il présentait également un inconvénient majeur : aucune protection contre les pannes de disque. Même la panne d'un seul disque pouvait détruire l'ensemble de la matrice. Pour une utilisation pratique, en particulier dans les environnements d'entreprise où la perte de données est inacceptable, le RAID 0 seul ne suffit pas.

Les chercheurs de Berkeley l'ont compris dès le départ. Ils ont proposé toute une gamme de niveaux RAID, chacun offrant une combinaison utile de vitesse, de capacité et de tolérance aux pannes. Dans le prochain guide, nous nous intéresserons au RAID 1, qui met l'accent sur la sécurité des données grâce à la mise en miroir.

100% des personnes ont trouvé ce Base de connaissance commune utile

À propos de l'auteur

Kees Jan Meerman

Kees Jan Meerman

Managing Director, Stellar Data Recovery Europe

  • The Hague Security Delta
  • ISO 9001:2015 Certified
  • MKB Innovative
  • MVO Nederland
Call Me