Stockage : c’est quoi un RAID et comment ça marche

swiper Abonné

Le 02/08/2022 à 14h 27

#1

Je lirais l’article en rentrant mais d’ors et déjà, j’adore le sous titre xD

patos Abonné

Le 02/08/2022 à 14h 37

#2

Mais attention au RAID5 à fuir comme la peste avec les disques durs supérieurs à 2To: la probabilité d’une erreur de lecture incorrigible (donnée fournie pour chaque disque, de 10^14 à 10^17 pour les meilleurs) est de plus de 30% (sur 6 disques) ! C’est terrible, car ça annule le bloc et là, on prie pour la localisation du bloc (sachant que souvent les contrôleurs disent “fuck you”).

C’est moins pareil avec les SSDs, mais ça craint quand même parfois du cul.

Xandr0s Abonné

Le 02/08/2022 à 15h 52

#2.1

Sur des NAS Qnap 6 et 8 baies, en 10 ans, j’ai déjà eu des problèmes de disques (gamme entreprise), mais pas de RAID. En tout cas, je n’en ai pas été notifié.

stylersnico Abonné

Le 02/08/2022 à 16h 07

#2.2

Xandr0s

Sur des NAS Qnap 6 et 8 baies, en 10 ans, j’ai déjà eu des problèmes de disques (gamme entreprise), mais pas de RAID. En tout cas, je n’en ai pas été notifié.

On n’utilise pas de NAS QNAP, Syno ou autres marques de “particuliers / power users”, c’est soit du HPE ou du NETAPP, mais sur des HPE, tu peux avoir ce genre de messages avec du Raid 5 : https://content.spiceworksstatic.com/service.community/p/post_images/0000285472/5a30490f/attached_image/ProLiant350.png

Et pour parler du cas le plus courant, des vieux hyperviseurs avec beaucoup de VMs et bien les données prenaient vraiment un coup quand tu avais ce message après un rebuild qui ne marchait pas.

Xandr0s Abonné

Le 02/08/2022 à 16h 49

#2.3

stylersnico

On n’utilise pas de NAS QNAP, Syno ou autres marques de “particuliers / power users”, c’est soit du HPE ou du NETAPP, mais sur des HPE, tu peux avoir ce genre de messages avec du Raid 5 : https://content.spiceworksstatic.com/service.community/p/post_images/0000285472/5a30490f/attached_image/ProLiant350.png

Et pour parler du cas le plus courant, des vieux hyperviseurs avec beaucoup de VMs et bien les données prenaient vraiment un coup quand tu avais ce message après un rebuild qui ne marchait pas.

Oui, c’est sur que sur matos d’entreprise les messages sont plus verbeux.
J’ai un DD actuellement (depuis quelques jours) mis en défaut pour des erreurs d’allocation…
Il va falloir que j’en commande un autre rapidement.

Wosgien Abonné

Le 02/08/2022 à 14h 41

#3

Juste pour être clair sur le RAID5 en écriture: dans le cas de 4 disques, si on veut écrire un secteur sur le disque 1:

le contrôleur lit les données des disques 2 et 3 (par exemple, mais toujours N-2 disques)

le contrôleur écrit ensuite les données sur le disque 1 et la parité sur le disque 4

–> Avec des SSD, c’est rapide, mais on multiple les écritures.
–> Avec des disques durs, il faut bien s’imaginer qu’il va falloir attendre le plus lent des disques à chaque fois.

Le principe de base est très simple, c’est basé des propriétés du XOR (disque 4=disque 1 XOR disque 2 XOR disque 3 -> si on perd disque 4 on a toujours les données, si on perd disque 2, sa donnée c’est disque 4 XOR disque 3 XOR disque 1)

vince120 Abonné

Le 02/08/2022 à 14h 49

#4

C’est quoi RAID : c’est très utile en été, ça tue les moustiques.
Comment ça marche : enlever le bouchon, viser les moustiques, appuyer sur le spray

stylersnico Abonné

Le 02/08/2022 à 14h 50

#5

Attention avec les RAID5 et 6 :
. https://www.zdnet.com/article/why-raid-5-stops-working-in-2009/
. https://www.zdnet.com/article/why-raid-6-stops-working-in-2019/

En entreprise (chez nous en tout cas), c’est full RAID 10 (ou raid 1), le RAID 6 on n’a jamais trop utilisé mais, le RAID 5 s’est souvent mal fini surtout sur des pools de stockages bien remplis.

fdorin Abonné

Le 02/08/2022 à 15h 23

#5.1

Le RAID 6 n’est pas mort. L’avantage du RAID 6, c’est qu’il peut supporter m disques défaillants sur n, avec m >= 2. On voit souvent que c’est limité à 2, mais c’est une erreur et cela peut aller bien plus loin !

Maintenant, c’est comme tout : il faut dimensionner son RAID en fonction des risques que l’on est prêt à accepter.

L’article de zdnet concernant le RAID 6, je le trouve bien incomplet, sur plusieurs points :

il est limité à 2 disques défaillants (ce qui est faux)

l’article assume qu’un disque présentant 1 défaut de lecture est totalement inutilisable (ce qui n’est pas vrai non plus)

l’article prétend que les défaillances de disques sont corrélés. C’est en partie vrai… pour les disques d’une même série. C’est pour cela qu’il est recommandé de prendre des disques de séries différentes dans un RAID 5 ou 6

les disques sont SMART aujourd’hui et un bon NAS en tient compte et est capable d’avertir dès qu’une erreur survient ou est sur le point de survenir.

Là où l’article devient intéressant, c’est sur l’augmentation du risque et la probabilité croissante d’avoir des soucis, compte tenu que la taille des disques ne cesse d’augmenter (le To est la norme maintenant) de même que le nombre de disques par grappe.

Bref, pour un RAID 6, si on a peur, on peut limiter la taille de la grappe (soit vis-à-vis du nombre de disques, soit vis-à-vis de leur capacité), ou augmenter le nombre de disques de parité.

Et il ne faut pas oublier non plus que si les NAS gèrent de plus en plus de disques, il est tout à fait possible d’y avoir plusieurs grappes plus petites (réduisant ainsi les risques de défaillance par grappe). Et aujourd’hui, hormis des cas très spécifique, je ne vois guère d’intérêt à avoir une seule et unique grappe de 10To (pour reprendre l’exemple de zdnet).

Pour la reconstruction, j’en ai déjà eu 2 sur mon NAS “personnel” (bais 4 disque, RAID 6 avec 2 disques de parité). La reconstruction prend une nuit, les données restant toujours accessibles et le changement de disque défectueux se faisant à chaud.

Et pour la petite histoire, j’ai déjà eu un disque dur neuf refusé par mon NAS, au motif qu’il présentait des erreurs (remontées via SMART justement). Ce même disque, monté dans un PC classique, ne montrait aucun problème (à l’usage ou via SMART). Du coup, je m’en sers comme périphérique pour des données volumineuses et peu importantes (juste au cas où !)

CR_B7 Abonné

Le 02/08/2022 à 18h 31

#5.2

Chez nous on a fait pas mal de raid 5, jamais eu de soucis.
Par contre tous est supervisé et on ne laisse jamais traîner un disque hs.
Par contre on parle de disques ‘pro’, sas sur des cartes raid hp de bonnes factures.
On est loin des fonctionnalités des cartes grand public.

Wosgien Abonné

Le 02/08/2022 à 14h 57

#6

stylersnico a dit:

En entreprise (chez nous en tout cas), c’est full RAID 10 (ou raid 1), le RAID 6 on n’a jamais trop utilisé mais, le RAID 5 s’est souvent mal fini surtout sur des pools de stockages bien remplis.

En entreprise, tu as généralement des contrôleurs de malade, loin, très loin de ce qu’on trouve en grand public en termes de performances et fiabilité. En plus, en général chaque grappe est elle-même doublée pour les données actives dans une autre salle (pas forcément pour les données de backup)

Sans compter que les disques durs utilisés ne sont pas vraiment les mêmes (en tout cas niveau tarif :( )

Donc on peut se permettre le RAID 5.

Par contre, je suis d’accord: en 2,5ans d’admin, il y a eu plusieurs pannes disque, c’est très courant (4 baies d’une vingtaine de disques)

stylersnico Abonné

Le 02/08/2022 à 16h 03

#6.1

Non et non.
Les contrôleurs de malade / disques de malades peuvent aussi avoir des bugs de malade (voir le dernier bug HPE avec les SSD qui s’effaçaient tous après X heures de fonctionnement).

Et croire que tout le stockage de toutes les entreprises est systématiquement doublé sur un autre site, c’est un beau rêve (mais ça reste un rêve et ça n’enlève pas les bugs de firmwares qui sont légion pour pourrir de la data).

Ce qui est systématique (et encore pas chez tout le monde selon certains articles qui passent) ce sont les sauvegardes qui permettent de récupérer les données malgré les problèmes sur le stockage.

euclide816 Abonné

Le 02/08/2022 à 15h 01

#7

A noter que pour le raid, il y a un autre “mode” logiciel : utiliser un FS évolué genre zfs ou btrfs
La différence ici est qu’avec une somme de contrôle des blocs, ces systèmes peuvent détecter et corriger le bitrot, ce dont un controleur raid (ou un raid software) est totalement incapable.

Pour être clair, ces système n’ont d’interêt que si on a plusieurs disques. Ils gèrent eux même les fonctions raid

PushTheRedButton Abonné

Le 02/08/2022 à 15h 08

#8

Article très synthétique et intéressant, merci. J’attends impatiemment la suite ! 👍

ragoutoutou Abonné

Le 02/08/2022 à 15h 23

#9

Le bug, c’est mettre un R devant le AID 0

tazvld Abonné

Le 02/08/2022 à 15h 32

#10

Tiens, je viens de me poser une question, il existe des algorithme de correction des erreurs comme le code de Hamming (dont le taux d’erreur est egal à la redondance : donc pas de perte d’espace plus que la perte acceptable). De tels algorithmes permettent de faire des sortes de RAID 6 tout en pouvant corriger des erreurs elle même accumuler ponctuellement (des fichiers corrompus).

Existe-t’il des RAID qui utilise de tels algo ?

Xandr0s Abonné

Le 02/08/2022 à 16h 57

#11

J’hésite à prendre chez Western cette fois et non plus Seagate. En gamme NAS ou Entreprise (mais l’écart de prix est faible entre les deux gammes).
J’ai l’impression que les Enterprise/Exos ne tiennent pas assez longtemps à mon goût.

fdorin Abonné

Le 02/08/2022 à 18h 20

#11.1

Ca peut servir ;)

Xandr0s Abonné

Le 02/08/2022 à 18h 29

#11.2

fdorin

Ca peut servir ;)

Oui, mais eux, ce sont des disques “ grand publique “. Je vise les gammes NAS ou entreprise.
Mais ça peut orienter un peu.

fdorin Abonné

Le 02/08/2022 à 19h 49

#11.3

Xandr0s

Oui, mais eux, ce sont des disques “ grand publique “. Je vise les gammes NAS ou entreprise.
Mais ça peut orienter un peu.

A ma connaissance, ils utilisent des gammes de disques conçus pour les NAS et les serveurs. Pas du grand public.

Et après une vérification sur quelques références, il semblerait que ce soient bien des disques pour NAS et serveurs

Xandr0s Abonné

Le 02/08/2022 à 20h 21

#11.4

fdorin

A ma connaissance, ils utilisent des gammes de disques conçus pour les NAS et les serveurs. Pas du grand public.

Et après une vérification sur quelques références, il semblerait que ce soient bien des disques pour NAS et serveurs

Effectivement, mais pour les Seagate, il y a des références en … DM…., qui si je ne me trompe pas, sont des gammes bureautique.
Mais effectivement, merci de m’avoir fait remarqué que c’était des gammes NAS/Entreprise.

Inodemus Abonné

Le 02/08/2022 à 19h 09

#12

patos a dit:

Mais attention au RAID5 à fuir comme la peste avec les disques durs supérieurs à 2To: la probabilité d’une erreur de lecture incorrigible (donnée fournie pour chaque disque, de 10^14 à 10^17 pour les meilleurs) est de plus de 30% (sur 6 disques) !

C’est terrible, car ça annule le bloc et là, on prie pour la localisation du bloc (sachant que souvent les contrôleurs disent “fuck you”).

Ca dépend grandement de comment c’est implémenté. Si le disque renvoie bien une erreur, normalement le contrôleur devrait recalculer les données à partir des autres (donc les données sortent juste), et éventuellement réécrire plus tard sur le disque qui a merdé. Et même s’il se contente de balancer une erreur de lecture, ça remontera jusqu’à l’OS et soit l’OS soit l’utilisateur refera une tentative, qui passera.

Et je doute fort que ça invalide un bloc, le but du RAID est aussi que ça reste en ligne, et donc quand un disque merde, on fait avec les autres, on ne bloque pas les opérations, et on ne modifie jamais les données des autres disques tant qu’on n’a pas pu de nouveau accéder au disque foireux, qui est alors reconstruit depuis les autres et non l’inverse.

Pour ma part, j’utilise du RAID 5 au quotidien depuis 15 ans sur 4 disques de tailles grandissantes. J’ai connu plein de pannes de disques et de reconstructions partielles ou totales, mais je n’ai jamais eu de souci lié à ce taux d’erreur de lecture. Je ne dis pas que ça ne s’est jamais produit, mais que si ça s’est produit, mes contrôleurs s’en sont très bien sorti car je n’ai rien perdu et même rien vu.

stylersnico a dit:

Attention avec les RAID5 et 6 : . https://www.zdnet.com/article/why-raid-5-stops-working-in-2009/ . https://www.zdnet.com/article/why-raid-6-stops-working-in-2019/

Je ne suis pas d’accord, voir plus haut et le message de fdorin. Les RAID 5 ne s’auto-détruise normalement pas sur une erreur de lecture quand ils sont déjà au minimum de disque, au pire il s’arrêtent juste et si c’était juste une erreur passagère, on peut les redémarrer ensuite, même si c’était pendant une reconstruction.

En fait il y a plein de moyens de traiter les erreurs, mais entre ce qu’il est théoriquement possible de faire de mieux et ce qui est réellement implémenté, il peut y avoir un gouffre.

En entreprise (chez nous en tout cas), c’est full RAID 10 (ou raid 1), le RAID 6 on n’a jamais trop utilisé mais, le RAID 5 s’est souvent mal fini surtout sur des pools de stockages bien remplis.

Mal fini à cause de quoi ? Je pense plutôt à des vraies pannes de disque survenant au mauvais moment, mais pas à des problèmes liés au taux d’erreur. Mais dis-moi si je me trompe.

patos Abonné

Le 02/08/2022 à 20h 39

#12.1

Tu me comprendras quand tu auras eu une LUN RAID 5 12 disques qui a eu la corruption en plein fichier de base de données…. : moteur crashé, VM en vrac, etc…. Ca s’appelle une mauvaise journée ^_^ (moi ça allait, j’étais le dépanneur hihihi)

Ces NAS gèrent le scrubbing pour lutter contre la corruption silencieuse, mais tu as eu de la chance si toutes tes reconstructions en 8 disques supérieurs à 2To ce sont toutes faites en Raid5. Sans scrubbing, elles auraient toutes chié.

On ne mets pas du RAID10 pour les mêmes raisons. D’ailleurs, en général, c’est du RAID01: un RAID0 de RAID1 (2 ou 3 disques selon le degré de parano): seuls ²⁄₃ disques sont utilisés, ce qui permet un taux de réponse accru par rapport aux RAID5/6 qui nécessitent que la grappe complète soit prête. Pour optimiser cela, on fait aussi du RAID50/60 sur de grosses grappes (supérieures à 50 disques). Ca permet de taper les 1/2Go/s avec des disques durs 15Ktpm, et 6-7Go/s en SSD (oui, merci le cache contrôleur).

Les serveurs de bases de données Oracle / SQL Server gros modèles sont typiquement ainsi (on parle de 40 coeurs / 500Go+ de ram).

Oui, le RAID Logiciel existe. ZFS, LVM & Windows Storage Spaces en sont.
Par contre, tu as intérêt à ne pas avoir de gros besoins en performances si tu as de petites configurations: les canaux SATA/SAS sont saturés, la pile de gestion rends les autres process léthargiques, etc…
Bien dimensionné, ça marche, mais il faut dédier ces machines au stockage et rien d’autres, quelque-soit leur puissance (j’ai rendu anémique une machine à 30K€HT avec LVM ou Storage Spaces et une trentaine de disques).

Xandr0s Abonné

Le 02/08/2022 à 20h 47

#12.2

patos

Tu me comprendras quand tu auras eu une LUN RAID 5 12 disques qui a eu la corruption en plein fichier de base de données…. : moteur crashé, VM en vrac, etc…. Ca s’appelle une mauvaise journée ^_^ (moi ça allait, j’étais le dépanneur hihihi)

Ces NAS gèrent le scrubbing pour lutter contre la corruption silencieuse, mais tu as eu de la chance si toutes tes reconstructions en 8 disques supérieurs à 2To ce sont toutes faites en Raid5. Sans scrubbing, elles auraient toutes chié.

On ne mets pas du RAID10 pour les mêmes raisons. D’ailleurs, en général, c’est du RAID01: un RAID0 de RAID1 (2 ou 3 disques selon le degré de parano): seuls ²⁄₃ disques sont utilisés, ce qui permet un taux de réponse accru par rapport aux RAID5/6 qui nécessitent que la grappe complète soit prête. Pour optimiser cela, on fait aussi du RAID50/60 sur de grosses grappes (supérieures à 50 disques). Ca permet de taper les 1/2Go/s avec des disques durs 15Ktpm, et 6-7Go/s en SSD (oui, merci le cache contrôleur).

Les serveurs de bases de données Oracle / SQL Server gros modèles sont typiquement ainsi (on parle de 40 coeurs / 500Go+ de ram).

Oui, le RAID Logiciel existe. ZFS, LVM & Windows Storage Spaces en sont.
Par contre, tu as intérêt à ne pas avoir de gros besoins en performances si tu as de petites configurations: les canaux SATA/SAS sont saturés, la pile de gestion rends les autres process léthargiques, etc…
Bien dimensionné, ça marche, mais il faut dédier ces machines au stockage et rien d’autres, quelque-soit leur puissance (j’ai rendu anémique une machine à 30K€HT avec LVM ou Storage Spaces et une trentaine de disques).

Merci pour le terme, je ne connaissais pas.
Oui, peut être de la chance. Mais c’est passé jusque là pour les reconstructions.
À voir avec le dernier disque qui est vraiment bien malade.

stylersnico Abonné

Le 03/08/2022 à 07h 38

#12.4

patos

Tu me comprendras quand tu auras eu une LUN RAID 5 12 disques qui a eu la corruption en plein fichier de base de données…. : moteur crashé, VM en vrac, etc…. Ca s’appelle une mauvaise journée ^_^ (moi ça allait, j’étais le dépanneur hihihi)

Ces NAS gèrent le scrubbing pour lutter contre la corruption silencieuse, mais tu as eu de la chance si toutes tes reconstructions en 8 disques supérieurs à 2To ce sont toutes faites en Raid5. Sans scrubbing, elles auraient toutes chié.

On ne mets pas du RAID10 pour les mêmes raisons. D’ailleurs, en général, c’est du RAID01: un RAID0 de RAID1 (2 ou 3 disques selon le degré de parano): seuls ²⁄₃ disques sont utilisés, ce qui permet un taux de réponse accru par rapport aux RAID5/6 qui nécessitent que la grappe complète soit prête. Pour optimiser cela, on fait aussi du RAID50/60 sur de grosses grappes (supérieures à 50 disques). Ca permet de taper les 1/2Go/s avec des disques durs 15Ktpm, et 6-7Go/s en SSD (oui, merci le cache contrôleur).

Les serveurs de bases de données Oracle / SQL Server gros modèles sont typiquement ainsi (on parle de 40 coeurs / 500Go+ de ram).

Oui, le RAID Logiciel existe. ZFS, LVM & Windows Storage Spaces en sont.
Par contre, tu as intérêt à ne pas avoir de gros besoins en performances si tu as de petites configurations: les canaux SATA/SAS sont saturés, la pile de gestion rends les autres process léthargiques, etc…
Bien dimensionné, ça marche, mais il faut dédier ces machines au stockage et rien d’autres, quelque-soit leur puissance (j’ai rendu anémique une machine à 30K€HT avec LVM ou Storage Spaces et une trentaine de disques).

Du Raid 5 à 12 disques, c’est du suicide, j’espère que celui qui avait cela à l’époque est en retraite maintenant pour pas que d’autres dépannent cela de nouveau.

Et, généralement, sur du RAID 60, sur les configurations de disques que l’on utilise (toujours moins de 24 par SAN) on tombe sur les mêmes capacités utilisables que le RAID 10 (sauf si nos calculs ont toujours été foireux, mais comme dit, on a eu tellement de soucis avec le RAID 5 que l’on a jamais utilisé autre chose que le 10 ensuite).

stylersnico Abonné

Le 03/08/2022 à 07h 32

#12.3

Si, des problèmes liés aux taux d’erreurs, j’en ai parlé sur un autre commentaire (mais sur des gros volumes et avec énormément d’I/O pour du RAID 5).

Puis bon, maintenant, on met tout en full flash en raid 10, les performances n’ont rien à voir avec du RAID 5 et les problèmes potentiels sont tous évités.

CR_B7 Abonné

Le 02/08/2022 à 21h 11

#13

patos a dit:

Tu me comprendras quand tu auras eu une LUN RAID 5 12 disques qui a eu la corruption en plein fichier de base de données…. : moteur crashé, VM en vrac, etc…. Ca s’appelle une mauvaise journée ^_^ (moi ça allait, j’étais le dépanneur hihihi)

Le raid n’est pas un soucis, l’augmentation du nombre de disque si.
12 pour moi c’est du suicide.
Soit il faut segmenter, soit passer en raid 6 soit 0+1
Au dessus de 5 à 6 disques j’ai toujours refusé le raid 5

patos Abonné

Le 02/08/2022 à 22h 13

#13.1

C’est compté en disques pleins, pas en milliard d’octets (oui flemme).
Ca permet de se rendre compte de la probabilité d’une erreur irrécupérable sur un disque.
Sachant que :

10^14 = soupe pour pc de bureau.

10^15 = WD Gold / HC / Seagate moyen.

10^16 = Seagate bon et peut être quelques WD (hors catalogue, spécial DELL/HP/NETAPP). La plupart des disques 2”5 10K/15K également (<1.2TB). SSD entreprises

10^17 = SSD Entreprises haut de gamme. Quelques rares HDDs hors de prix.
Et qu’on multiplie par le nombre de disques dans la grappe ^_^

To / Taux d’erreur 10^14 10^15 10^16 10^17
2 To 17,59% 1,76% 0,18% 0,02%
4 To 35,18% 3,52% 0,35% 0,04%
6 To 52,78% 5,28% 0,53% 0,05%
8 To 70,37% 7,04% 0,70% 0,07%
10 To 87,96% 8,80% 0,88% 0,09%
12 To 105,55% 10,56% 1,06% 0,11%
14 To 123,15% 12,31% 1,23% 0,12%
16 To 140,74% 14,07% 1,41% 0,14%
18 To 158,33% 15,83% 1,58% 0,16%

Moi je refuse toujours le RAID5. Cette techno n’existe pas à mes yeux.

Je ne choisi pas ce que je dépanne….
Moi je les aurais mis en RAID01 double miroir: un RAID 0 de 4 groupes de RAID1 de 3 disques (en plus ça donne plus de patate hihihi), ou au pire en RAID6 avec un hotspare.

Les LOGs sont tout aussi critiques que la BDD:

Le moteur de base de données traite la transaction

Il écrit dans les logs les modifications à venir

Il vérifie l’écriture des modifications dans les logs

Il effectue les modifications dans la base de données.

C’est d’ailleurs pour ça que normalement, on fait 2 LUNs: une pour les logs, une pour la base (pour des raisons de performances).

Tant mieux si tu es passé entre les mailles du filet de Murphy.

Franchement, un disque dur entreprise en environnement entreprise, il n’a pas de défaut autre que sa fiche technique. Température, hygrométrie, ventilation… Tout cela est stable et contrôlé. Et on les arrête jamais.
Du coup, y’a que le Taux moyen de retour et taux d’erreur incorrigibles qui influencent le choix.
On s’en fout de savoir lequel des 2 est responsable de la panne. Tout ce qu’on sait, c’est qu’on doit mathématiquement minimiser le risque.
Et dans tous les cas, on sauvegarde au moins une fois par jour

Après ça n’est que mon avis, et il n’engage que moi ;)

Xandr0s Abonné

Le 03/08/2022 à 06h 20

#13.2

patos

C’est compté en disques pleins, pas en milliard d’octets (oui flemme).
Ca permet de se rendre compte de la probabilité d’une erreur irrécupérable sur un disque.
Sachant que :

10^14 = soupe pour pc de bureau.

10^15 = WD Gold / HC / Seagate moyen.

10^16 = Seagate bon et peut être quelques WD (hors catalogue, spécial DELL/HP/NETAPP). La plupart des disques 2”5 10K/15K également (<1.2TB). SSD entreprises

10^17 = SSD Entreprises haut de gamme. Quelques rares HDDs hors de prix.
Et qu’on multiplie par le nombre de disques dans la grappe ^_^

To / Taux d’erreur 10^14 10^15 10^16 10^17
2 To 17,59% 1,76% 0,18% 0,02%
4 To 35,18% 3,52% 0,35% 0,04%
6 To 52,78% 5,28% 0,53% 0,05%
8 To 70,37% 7,04% 0,70% 0,07%
10 To 87,96% 8,80% 0,88% 0,09%
12 To 105,55% 10,56% 1,06% 0,11%
14 To 123,15% 12,31% 1,23% 0,12%
16 To 140,74% 14,07% 1,41% 0,14%
18 To 158,33% 15,83% 1,58% 0,16%

Moi je refuse toujours le RAID5. Cette techno n’existe pas à mes yeux.

Je ne choisi pas ce que je dépanne….
Moi je les aurais mis en RAID01 double miroir: un RAID 0 de 4 groupes de RAID1 de 3 disques (en plus ça donne plus de patate hihihi), ou au pire en RAID6 avec un hotspare.

Les LOGs sont tout aussi critiques que la BDD:

Le moteur de base de données traite la transaction

Il écrit dans les logs les modifications à venir

Il vérifie l’écriture des modifications dans les logs

Il effectue les modifications dans la base de données.

C’est d’ailleurs pour ça que normalement, on fait 2 LUNs: une pour les logs, une pour la base (pour des raisons de performances).

Tant mieux si tu es passé entre les mailles du filet de Murphy.

Franchement, un disque dur entreprise en environnement entreprise, il n’a pas de défaut autre que sa fiche technique. Température, hygrométrie, ventilation… Tout cela est stable et contrôlé. Et on les arrête jamais.
Du coup, y’a que le Taux moyen de retour et taux d’erreur incorrigibles qui influencent le choix.
On s’en fout de savoir lequel des 2 est responsable de la panne. Tout ce qu’on sait, c’est qu’on doit mathématiquement minimiser le risque.
Et dans tous les cas, on sauvegarde au moins une fois par jour

Après ça n’est que mon avis, et il n’engage que moi ;)

Une préférence te le RAID 6, parce que plus de redondance des données ?

fdorin Abonné

Le 02/08/2022 à 21h 22

#14

patos a dit:

Tu me comprendras quand tu auras eu une LUN RAID 5 12 disques qui a eu la corruption en plein fichier de base de données…. : moteur crashé, VM en vrac, etc…. Ca s’appelle une mauvaise journée ^_^ (moi ça allait, j’étais le dépanneur hihihi)

Je précise d’avance que monter des RAIDs n’est pas mon métier. Mais un RAID 5 avec 12 disques pour stocker des bases de données, c’est pas un peu… suicidaire ? Quand un disque plante (et ça viendra, forcément, surtout avec 12 disques), le risque est tellement grand que pendant la reconstruction, un autre disque puisse montrer des faiblesses (surtout s’ils sont de la même série !).

Je pose la question comme tu as l’air du métier ;)

Après, pour des données non critique… comme des logs (peu de réécritures, beaucoup d’ajouts), why not…

[edit]
Grillé par CR_B7, qui pense la même chose de moi semble-t-il

Inodemus Abonné

Le 02/08/2022 à 21h 41

#15

patos a dit:

Tu me comprendras quand tu auras eu une LUN RAID 5 12 disques qui a eu la corruption en plein fichier de base de données…. : moteur crashé, VM en vrac, etc…. Ca s’appelle une mauvaise journée ^_^ (moi ça allait, j’étais le dépanneur hihihi)

Et comment tu sais que cette corruption venait du RAID, et plus spécifiquement du taux norm d’erreur de lecture et pas d’un réel défaut d’un disque ?

En plus les erreurs dues à ce taux peuvent tout aussi se produire sans RAID. M’est avis que si un contrôleur RAID amplifie ce problème, c’est qu’il est mal codé.

Ces NAS gèrent le scrubbing pour lutter contre la corruption silencieuse, mais tu as eu de la chance si toutes tes reconstructions en 8 disques supérieurs à 2To ce sont toutes faites en Raid5. Sans scrubbing, elles auraient toutes chié.

Merci pour le terme, je verrai à mettre ça en place dans le futur. Cependant j’en ai fait quelques unes des reconstructions avec des disques de 3 To depuis le temps, et elles ont toutes réussi. Jamais repéré d’erreur non plus en faisant des vérifications simples de temps en temps.

JohnHostfil Abonné

Le 03/08/2022 à 05h 28

#16

Mon expérience s’arrête à un raid0 de SSD pour l’installation de Windows il y a quelques années quand les SSD n’avaient que quelques centaines de Mo/s en lecture/écriture, mais c’est génial de pouvoir lire les commentaires des experts du stockage sur NXI.

fdorin Abonné

Le 03/08/2022 à 05h 57

#17

patos a dit:

Je ne choisi pas ce que je dépanne…. Moi je les aurais mis en RAID01 double miroir: un RAID 0 de 4 groupes de RAID1 de 3 disques (en plus ça donne plus de patate hihihi), ou au pire en RAID6 avec un hotspare.

Merci pour ton retour J’aurais sans doute fait quelque chose de similaire, avec peut être une hésitation entre un RAID01 et donner directement l’ensemble des RAID1 à la BD

Les LOGs sont tout aussi critiques que la BDD:

Entièrement d’accord. Sauf que je parlais pas de log de BD, mais de log tout court (dans ma tête, système de centralisation de log). Mais je suis passé un peu vite du coq à l’âne, je l’admet !

Inodemus Abonné

Le 03/08/2022 à 07h 16

#18

patos a dit:

Tant mieux si tu es passé entre les mailles du filet de Murphy.

Je n’y crois pas, les probabilités sont trop grandes. Et ce problème m’avait aussi interpellé avec l’augmentation des tailles de disques, car je sais aussi calculer les probabilités. Je m’étais demandé à l’époque comment ça allait se passer, mais finalement je trouve que ça se passe plutôt bien, autant hors RAID que dans un RAID. Par contre, je ne suis pas sûr de pourquoi ça se passe mieux que ça en a l’air, tu pourras peut-être m’éclairer.

Déjà, quand un bit est mal lu, est-ce que le disque renvoie une erreur ou est-ce qu’il renvoie un bit faux ? Je penche pour le premier cas, et il est facile à gérer soit par l’OS hors RAID (mais possible perte de données si réessayer échoue), soit par un contrôleur RAID correctement codé, et sans perte de données puisque recalcul depuis les autres disques. Le RAID devrait donc apporter une amélioration plutôt qu’une dégradation.

Si au contraire renvoie des données fausses, c’est plus embêtant car le contrôleur va s’en rendre compte, mais il va devoir choisir aléatoirement si c’est la donnée ou la parité qui est fausse, ce qui peut aboutir à une corruption. Mais la probabilité n’est alors augmentée par rapport à un disque seul que de maxi 20% pour un RAID5 de 5 disques, et seul le bit mal lu est affecté, pas la totalité du bloc.

patos Abonné

Le 03/08/2022 à 08h 27

#18.1

Un bit mal lu, c’est une erreur disque pour le contrôleur, qui retourne lui-même une erreur de lecture à l’OS si la redondance ne fait pas son taff. Si tu l’as sur un espace libre d’après l’OS, aucun souci. Si tu remplis tes disques toujours comme un salaud, les probabilités sont là.

Sauf les problèmes budgétaires

Il est facile de juger à postériori ;)

Les seules personnes qui faisaient du RAID60 font désormais du raid logiciel en ZFS/LVM/WSS ou du S3: ils faisaient ça parce qu’ils avait au moins 30 disques par serveur.
En RAID6, à partir de 6 disques, tu es gagnant par rapport au RAID10/01 en capacité (N-3: 2 disques de parité et un de hotspare). Surtout que sur des données critiques, on fait du RAID10 double miroir: 33% de l’espace disque utilisable.

Aujourd’hui, le seul cas où on fait du RAID5 sans sourciller, c’est en cas de clusters de serveurs où on veut limiter la maintenance. Vu qu’ils se répliquent en live, on estime à raison que c’est fiable et qu’on peut se permettre de baisser la fiabilité de la LUN de chaque serveur.
Par exemple, pour Exchange, Microsoft préconise même un JBOD ou RAID0 de 3 serveurs répliqués.

stylersnico Abonné

Le 03/08/2022 à 08h 56

#18.2

patos

Un bit mal lu, c’est une erreur disque pour le contrôleur, qui retourne lui-même une erreur de lecture à l’OS si la redondance ne fait pas son taff. Si tu l’as sur un espace libre d’après l’OS, aucun souci. Si tu remplis tes disques toujours comme un salaud, les probabilités sont là.

Sauf les problèmes budgétaires

Il est facile de juger à postériori ;)

Les seules personnes qui faisaient du RAID60 font désormais du raid logiciel en ZFS/LVM/WSS ou du S3: ils faisaient ça parce qu’ils avait au moins 30 disques par serveur.
En RAID6, à partir de 6 disques, tu es gagnant par rapport au RAID10/01 en capacité (N-3: 2 disques de parité et un de hotspare). Surtout que sur des données critiques, on fait du RAID10 double miroir: 33% de l’espace disque utilisable.

Aujourd’hui, le seul cas où on fait du RAID5 sans sourciller, c’est en cas de clusters de serveurs où on veut limiter la maintenance. Vu qu’ils se répliquent en live, on estime à raison que c’est fiable et qu’on peut se permettre de baisser la fiabilité de la LUN de chaque serveur.
Par exemple, pour Exchange, Microsoft préconise même un JBOD ou RAID0 de 3 serveurs répliqués.

Je ne vois pas dans l’avenir, donc je ne peux juger qu’à postériori

On ne fait que du RAID 10 basique, si les données sont réellement critiques, on ne compte pas sur du RAID pour en assurer la survie (réplication voir reprise auto + backup on-line / off-line entres autres).

Inodemus Abonné

Le 03/08/2022 à 07h 25

#19

JohnHostfil a dit:

Mon expérience s’arrête à un raid0 de SSD pour l’installation de Windows il y a quelques années quand les SSD n’avaient que quelques centaines de Mo/s en lecture/écriture

Je n’ai fait qu’un RAID0 de ma vie, avec deux disques durs de 100 Go, pour mettre l’OS dessus. Il est mouru un jour, comme je m’y attendais, par contre je n’avais pas anticipé que ça puisse se passer alors que j’étais à l’extérieur pour une LAN.

Du coup grosse galère pour trouver quelqu’un avec un CD d’install de Windows et les drivers pour mon matériel (pas d’Internet sur place). J’en ai plus refait depuis, et j’ai rajouté les CDs d’installation à mes bagages en LAN.

Gilbert_Gosseyn Abonné

Le 03/08/2022 à 09h 48

#20

stylersnico a dit:

Attention avec les RAID5 et 6 : . https://www.zdnet.com/article/why-raid-5-stops-working-in-2009/ . https://www.zdnet.com/article/why-raid-6-stops-working-in-2019/

En entreprise (chez nous en tout cas), c’est full RAID 10 (ou raid 1), le RAID 6 on n’a jamais trop utilisé mais, le RAID 5 s’est souvent mal fini surtout sur des pools de stockages bien remplis.

Il te faut toujours au moins un disque de spare en secours, en plus de ton RAID. C’est ce qu’on fait nous au boulot.

Westvleteren Abonné

Le 03/08/2022 à 10h 08

#21

L’article explique certaines notions, mais me semble oublier un point clé : Le RAID ne sert que pour augmenter la disponibilité des données et pas leur intégrité, et souvent dans le monde des particuliers c’est moins utile qu’une bonne sauvegarde.

Je m’explique. Mes photos ou films de famille, je ne veux pas les perdre. Il est beaucoup plus important et plus utile pour moi d’avoir une sauvegarde sur un autre disque/PC, que de faire du RAID 1. Je peux attendre pour accéder à mes photos le temps de racheter un disque et restaurer ma sauvegarde dessus, mais je pense que perdre les données serait une catastrophe irrécupérable.

Les entreprises elles, font des sauvegardes (ou devraient le faire), et elles veulent aussi la disponibilité donc elles font aussi du RAID.
Mais je pense que c’est rare qu’un particulier ait vraiment besoin de la disponibilité apportée par le RAID, et qu’il vaut bien mieux commencer par la sauvegarde.

Autre point, le RAID matériel (via carte/contrôleur sur la carte) ne me semble pas optimum pour les particuliers. En cas de perte du contrôleur matériel, il faut souvent retrouver un contrôleur identique pour lire les données, alors qu’avec du RAID logiciel ce problème n’existe pas. Note : ce point a peut-être progressé avec la normalisation des solutions, des BIOS/UEFI…
De plus, les solutions avancées de gestion des volumes (Windows ou certains file systems Linux) proposent des équivalents au RAID, bien plus souples.

bielorusse320

Le 03/08/2022 à 10h 20

#21.1

Je suis bien d’accord. J’ai arrêté de faire du RAID sur mon NAS et je ne prévois pas de le refaire. Par contre, il faut deux sauvegardes mini dont une hors site.

Scarfy

Le 03/08/2022 à 10h 45

#22

Comment récupérer les données d’un cluster en RAID 5 ?
Il y a quelques années, j’avais 3 disques de 3 TO en RAID 5, et un disque est mourru subitement. Confiant, j’achète un nouveau disque de même capacité et remplace (à froid) celui qui était défaillant. Je rallume le pc, confirme la reconstruction et là, c’est le drame. Ca a tout mélangé, haché, plus rien n’était lisible. En regardant les “secteurs” du cluster, je voyais des bouts du fichier avec du random en plein milieu (ou au début ou à la fin).
J’ai conservé les disques au cas où, un jour, je trouverais la solution miracle…

Inodemus Abonné

Le 03/08/2022 à 10h 58

#23

patos a dit:

Un bit mal lu, c’est une erreur disque pour le contrôleur, qui retourne lui-même une erreur de lecture à l’OS si la redondance ne fait pas son taff. Si tu l’as sur un espace libre d’après l’OS, aucun souci. Si tu remplis tes disques toujours comme un salaud, les probabilités sont là.

OK merci pour la précision, dans ce cas le contrôleur devrait utiliser la redondance pour corriger l’erreur, voire réécrire sur le disque qui n’a pas répondu. Au pire s’il ne le fait pas (ce qui serait mal fichu), l’OS recevra une erreur et pourra réessayer. Mais c’est à quel moment que les données se corrompent ?

Gilbert_Gosseyn a dit:

Il te faut toujours au moins un disque de spare en secours, en plus de ton RAID. C’est ce qu’on fait nous au boulot.

Si tu fais du RAID5 avec un disque de spare, autant presque faire du RAID6 à la place.

tractopelle a dit:

Autre point, le RAID matériel (via carte/contrôleur sur la carte) ne me semble pas optimum pour les particuliers. En cas de perte du contrôleur matériel, il faut souvent retrouver un contrôleur identique pour lire les données, alors qu’avec du RAID logiciel ce problème n’existe pas.

Il faut essayer de se renseigner avant, mais c’est pas facile. Pour ma part, mes volumes RAID ont toujours été lisibles par d’autres contrôleurs de la même marque, plus récents ou plus anciens. Mais je n’ai pas non plus essayé tous ceux de cette marque, et je connais un modèle d’une autre marque où même mettre à jour le BIOS du contrôleur l’empêchait de rouvrir tes volumes.

Note : ce point a peut-être progressé avec la normalisation des solutions, des BIOS/UEFI…

Je ne crois pas non.

Inodemus Abonné

Le 03/08/2022 à 11h 01

#24

Scarfy a dit:

Comment récupérer les données d’un cluster en RAID 5 ? Il y a quelques années, j’avais 3 disques de 3 TO en RAID 5, et un disque est mourru subitement. Confiant, j’achète un nouveau disque de même capacité et remplace (à froid) celui qui était défaillant. Je rallume le pc, confirme la reconstruction et là, c’est le drame. Ca a tout mélangé, haché, plus rien n’était lisible. En regardant les “secteurs” du cluster, je voyais des bouts du fichier avec du random en plein milieu (ou au début ou à la fin). J’ai conservé les disques au cas où, un jour, je trouverais la solution miracle…

C’est la merde, il faudrait savoir ce qu’a fait le contrôleur et appliquer la logique inverse (en espérant qu’il n’ait pas écrasé des trucs). Il faudrait que tu retrouves tous les bouts d’un fichier pour comprendre comment il l’a mélangé, mais c’est vraiment pas gagné.

Ca me fait penser à la fois où j’avais effacé un volume RAID5 par erreur et où je ne connaissais pas l’ordre des 4 disques. J’ai pris un ordre au hasard, recréé le volume (sans formatage) puis regardé si j’arrivais à voir la partition, supprimé le volume, changé l’ordre, recommencé jusqu’à ce que j’arrive à monter le système de fichiers puis à lister le contenu du répertoire racine, puis jusqu’à ce que ce contenu soit correct. C’était un peu flippant mais finalement il n’y avait aucun risque tant qu’on n’écrivait rien.

Wosgien Abonné

Le 03/08/2022 à 11h 59

#25

patos a dit:

Les seules personnes qui faisaient du RAID60 font désormais du raid logiciel en ZFS/LVM/WSS ou du S3: ils faisaient ça parce qu’ils avait au moins 30 disques par serveur.

C’est fini cette longue litanie sur les erreurs dans la mémoire qui affecteraient tout RAID ZFS (limité par l’ECC, mais pas éradiqué)

Parce que on a quand même tendance à faire du FUD sur des incidents graves, sans compter les milliers de jours où tout se passe bien.

Le RAID, c’est la haute dispo. Le backup, c’est la sécurité.

Aujourd’hui, le seul cas où on fait du RAID5 sans sourciller, c’est en cas de clusters de serveurs où on veut limiter la maintenance. Vu qu’ils se répliquent en live, on estime à raison que c’est fiable et qu’on peut se permettre de baisser la fiabilité de la LUN de chaque serveur.

Le RAID5, ça marche, ça pose des risques, mais qu’est-ce qui ne pose pas de risques sur des LUN de 12To?
La technique ne fait pas tout, l’architecture soft non plus. Il y a un moment où il faut jouer des 2.

Et surtout, il y a beaucoup de moments où le financier te dicte de mettre le RAID5, car c’est ce qui rentre dans le budget.

Wosgien Abonné

Le 03/08/2022 à 12h 05

#26

Scarfy a dit:

Comment récupérer les données d’un cluster en RAID 5 ?

L’implémentation n’est pas standard à ma connaissance. Ca dépend de l’équipement dans lequel c’était installé.

Pour ton problème, il faudrait:

Regarder la taille des blocs de texte lisibles (512 octets, 4ko).

Essayer de voir si de temps en temps, le bloc n° X du disque 2 ne serait pas la suite du bloc X du disque 1

Quand tu vois du RANDOM dans le bloc Y, tu dois faire l’opération (bloc Y disque 1) XOR (bloc Y disque 2) -> ça devrait te donner le contenu réel.

Mais ça peut être beaucoup plus compliqué selon les stratégies d’allocation du contrôleur…

Hereziark Abonné

Le 03/08/2022 à 14h 16

#27

Merci beaucoup Sébastien pour cet article !

Comme souvent, on en apprend encore plus dans les commentaires ! Merci à tous ceux qui y contribuent. :oui2:
(même si je ne comprends pas tout parce que je suis pas assez calé dans le domaine… )

smanu Abonné

Le 03/08/2022 à 14h 35

#28

Sympa l’article et également les commentaires toujours très intéressants.
Pour ma part, j’ai plutôt fait du Raid5 mais il y a des sauvegardes externes tous les soirs. Pour le moment, j’ai eu quelques disques qui ont lâché mais jamais de souci à retrouver un Raid5 fonctionnel, suis je super chanceux !? Je ne sais pas. En tout cas, c’était avec des NAs de 4 ou 5 disques 3 à 4 To (Thecus, Qnap, Synology).
Le Nas me sert pour un premier backup donc si cela venait à lâcher, pas de grosses pertes. Sur le serveur, c’est raid 1+0 et raid 1. Déjà eu des couacs mais cela se reconstruit assez vite…

Dude76 Abonné

Le 03/08/2022 à 14h 39

#29

Je me sentais confiant dans mon Syno à 4 Hdd dans leur système hybrid (SHR) “équivalent” à du RAID 5, mais avec tout ce que je lis là dans les commentaires, ça m’inquiète !
J’avais pris la peine de prendre des disques NAS (WD RED de mémoire, tous dans une série différente), pour éviter une possible panne au même moment, et jusque-là, aucune panne ni alerte.
Je vais me re-pencher sur la fiabilité du truc…

cquest Abonné

Le 03/08/2022 à 14h 41

#30

Le RAID 0 c’est pire que 0 sécurité, on multiplie les chances de pannes en additionnant celles de chaque disque physique.

A quand un article sur les filesystem modernes qui gèrent cela de façon bien plus souple ? BTRFS, et surtout ZFS…

redondance et/ou performance

compression de données transparente

checksum de toutes les données

snapshots

chiffrement

accélération des HDD par du cache SSD
etc…

Quand on y goute, le RAID 0, 1, 0+1, 5, 6 ou 10 semble d’un autre age !

J’avais écrit un petit billet au sujet de ZFS: https://medium.com/@cq94/zfs-vous-connaissez-vous-devriez-1d2611e7dad6

phoenix35 Abonné

Le 03/08/2022 à 15h 21

#31

cquest a dit:

J’avais écrit un petit billet au sujet de ZFS: https://medium.com/@cq94/zfs-vous-connaissez-vous-devriez-1d2611e7dad6

Merci pour ce très bon résumé !

Scarfy

Le 03/08/2022 à 15h 45

#32

Inodemus a dit:

(quote:2087039:brice.wernet)

Merci à vous 2 !

choukky Abonné

Le 03/08/2022 à 16h 08

#33

vince120 a dit:

C’est quoi RAID : c’est très utile en été, ça tue les moustiques. Comment ça marche : enlever le bouchon, viser les moustiques, appuyer sur le spray

RAID = Baygon jaune

CR_B7 Abonné

Le 03/08/2022 à 20h 24

#34

cquest a dit:

Le RAID 0 c’est pire que 0 sécurité, on multiplie les chances de pannes en additionnant celles de chaque disque physique.

A quand un article sur les filesystem modernes qui gèrent cela de façon bien plus souple ? BTRFS, et surtout ZFS…

redondance et/ou performance

compression de données transparente

checksum de toutes les données

snapshots

chiffrement

accélération des HDD par du cache SSD etc…

Quand on y goute, le RAID 0, 1, 0+1, 5, 6 ou 10 semble d’un autre age !

J’avais écrit un petit billet au sujet de ZFS: https://medium.com/@cq94/zfs-vous-connaissez-vous-devriez-1d2611e7dad6

Il y a juste un petit hic :
https://linux.developpez.com/actu/290040/Linus-Torvalds-n-utilisez-pas-ZFS-jusqu-a-ce-que-j-aie-une-lettre-officielle-d-Oracle-signee-par-son-conseil-ou-par-Larry-Ellison-qui-nous-y-autorise-et-precise-que-le-produit-final-est-sous-GPL/

ragoutoutou Abonné

Le 03/08/2022 à 21h 42

#35

CR_B7 a dit:

Il y a juste un petit hic : https://linux.developpez.com/actu/290040/Linus-Torvalds-n-utilisez-pas-ZFS-jusqu-a-ce-que-j-aie-une-lettre-officielle-d-Oracle-signee-par-son-conseil-ou-par-Larry-Ellison-qui-nous-y-autorise-et-precise-que-le-produit-final-est-sous-GPL/

Le problème de licence concerne avant tout la redistribution du pilote, avec des acteurs comme Ubuntu qui se trouvent trop cools pour faire du dkms ( système qui recompile le pilote automatiquement à chaque mise à jour du noyau, utilisé pour les pilotes proprio des cartes graphiques et réseau par exemple ) et du coup préfèrent jouer avec une interprétation capillotractée de la licence GPL pour livrer directement le pilote binaire déjà compilé et lié.

Bref un précédent dangereux pouvant nuire gravement aux licenses GPL si la faille se confirme. Malheureusement, aucun acteur n’a porté plainte contre Canonical pour confirmer ou infirmer la validité du prétexte utilisé et crée un précédent dangereux en l’absence de critères d’ (in)validité de l’approche.

Si un utilisateur final décide d’intégrer ZFS pour son usage, pas d’ambiguïté: il en a de toutes façons parfaitement le droit.

Reste que si on veut rester clean avec ZFS, il y a un OS presque parfait pour ça: FreeBSD… d’expérience, hormis une situation problématique que j’ai rencontré avec Infiniband il y a quelques années, c’est une plateforme formidablement stable pour le stockage que je recommande en lieu et place de solutions GNU/Linux pour en environnement de stockage d’entreprise.

fofo9012 Abonné

Le 04/08/2022 à 07h 12

#36

patos a dit:

Un bit mal lu, c’est une erreur disque pour le contrôleur, qui retourne lui-même une erreur de lecture à l’OS si la redondance ne fait pas son taff. Si tu l’as sur un espace libre d’après l’OS, aucun souci. Si tu remplis tes disques toujours comme un salaud, les probabilités sont là.

C’est assez dingue, c’est clairement un pb de contrôleur, car il y’a toutes les infos pour que ça se passe bien :

Si un disque renvoie n’importe quoi, en calculant les sommes de contrôle des différents cas il est possible de détecter quel disque a renvoyé n’importe quoi, marquer ce secteur défectueux au niveau de chaque disque de la grappe, et remonter à l’OS de réécrire ce secteur plus loin sur le(s) disque(s). (C’est le fonctionnement avec un disque unique qui a un secteur défectueux).
A priori ça pourrait être transparent (si correctement implémenté par le contrôleur / OS), l’effet amplificateur, est que les bons secteurs des autres disques ne sont alors plus utilisés, car il y’a au moins un disque avec ce secteur défectueux.

À te lire, j’ai l’impression qu’à la première erreur, tout le disque est marqué HS, et que la grappe doit être entièrement reconstruite ; là effectivement, c’est catastrophique, il faut relire / recalculer toutes les sommes de contrôles, ce qui induit un stress énorme sur des disques dont l’un montre déjà un signe de faiblesse !

patos Abonné

Le 04/08/2022 à 18h 50

#36.1

Le problème c’est la seconde erreur: celle qui suit celle qui n’a pas été prévisible. Il faut tout faire pour l’éviter. Le RAID6 (double parité) permet une seconde chance, et c’est la troisième qui devient critique. En RAID6 triple parité ou en RAID1 double miroir, c’est la 4ième qui le devient.

Si le problème apparait dans une section de données critiques, c’est le logiciel qui se plante. Un Windows qui râle, on s’en fout. Une base de données qui se crashe, c’est pas la même… En pleine journée, une base de données de production à restaurer, c’est que la production est arrêtée ! Et ça ça ne doit pas arriver, ça coût des dizaines de milliers d’euros par heure sans…. (si ce n’est plus)

Wosgien Abonné

Le 04/08/2022 à 08h 58

#37

Dude76 a dit:

Je me sentais confiant dans mon Syno à 4 Hdd dans leur [système hybrid (SHR)]… du RAID 5, mais avec tout ce que je lis là dans les commentaires, ça m’inquiète !

smanu a dit:

Pour le moment, j’ai eu quelques disques qui ont lâché mais jamais de souci à retrouver un Raid5 fonctionnel, suis je super chanceux !?

Il ne faut pas s’arrêter des exemples catastrophiques. Dans la majorité des cas, ça fonctionne parfaitement du premier jour jusqu’à remplacement de la baie.

cquest a dit:

A quand un article sur les filesystem modernes qui gèrent cela de façon bien plus souple ? BTRFS, et surtout ZFS…
Quand on y goute, le RAID 0, 1, 0+1, 5, 6 ou 10 semble d’un autre age !

ZFS et LVM sont ce que l’on trouve sur des contrôleurs SAN. C’est un niveau supplémentaire d’abstraction/virtualisation du stockage.
Mais une bonne partie des fonctionnalités n’empêche pas de reposer sur un RAID (soft/hard).

Attention aussi: autant BTRFS peut être considéré comme un FS comme un autre, autant ZFS peut mener à de grosses consos de RAM: je préfère utiliser ZFS sur un serveur de stockage, mais pas sur un serveur applicatif. Par contre, BTRFS sur un applicatif, je n’ai rien contre.

Bref, dire que ZFS ringardise le RAID, c’est un peu comme dire que la gestion des noms de domaines rend vieillots les plans d’adressage IP. En fait, ce n’est pas tout à fait la même chose…

Mais je suis d’accord sur un point: mettre un RAID et utiliser directement le volume RAID tout entier, c’est le niveau 0 du stockage. Avoir une couche d’abstraction, de création de volumes différents par dessus le stockage physique, c’est un niveau très intéressant (quand tu te retrouves avec des volumes dédiés à plusieurs machines très similaires, mais que ces volumes ont des parties dédupliquées… miam)

CR_B7 Abonné

Le 04/08/2022 à 09h 17

#38

ragoutoutou a dit:

Le problème de licence concerne avant tout la redistribution du pilote, avec des acteurs comme Ubuntu qui se trouvent trop cools pour faire du dkms ( système qui recompile le pilote automatiquement à chaque mise à jour du noyau, utilisé pour les pilotes proprio des cartes graphiques et réseau par exemple ) et du coup préfèrent jouer avec une interprétation capillotractée de la licence GPL pour livrer directement le pilote binaire déjà compilé et lié.

Bref un précédent dangereux pouvant nuire gravement aux licenses GPL si la faille se confirme. Malheureusement, aucun acteur n’a porté plainte contre Canonical pour confirmer ou infirmer la validité du prétexte utilisé et crée un précédent dangereux en l’absence de critères d’ (in)validité de l’approche.

Si un utilisateur final décide d’intégrer ZFS pour son usage, pas d’ambiguïté: il en a de toutes façons parfaitement le droit.

Reste que si on veut rester clean avec ZFS, il y a un OS presque parfait pour ça: FreeBSD… d’expérience, hormis une situation problématique que j’ai rencontré avec Infiniband il y a quelques années, c’est une plateforme formidablement stable pour le stockage que je recommande en lieu et place de solutions GNU/Linux pour en environnement de stockage d’entreprise.

Pour moi le problème n’est pas la.
Ses est sous une licence à la noix, propriété de oracle.
Oracle est connue pour être franchement tordu.
Du coup pour linus soit Zfs rentre dans les clous au niveau licence, soit il vaut mieux ne pas trop l’intégrer

ragoutoutou Abonné

Le 04/08/2022 à 17h 43

#38.1

La licence est une chose, l’entreprise en est une autre… s’il faut critiquer une entreprise à l’heure actuelle, c’est Canonical qui s’obstine en maintenant son approche consistant à livrer le pilote binaire directement et qui crée une situation affaiblissant la licence du kernel. Pour le coup Oracle n’y est pour rien, le seul reproche qu’on pourrait leur faire c’est leur choix de licence pour leur logiciel, mais cela ne serait pas très correct pour le coup, mais ce n’est pas très pertinent face à Canonical qui méprise les techniques standard pour résoudre le problème en faveur d’une approche contraire à la licence GPL2.

Inodemus Abonné

Le 04/08/2022 à 10h 56

#39

cquest a dit:

A quand un article sur les filesystem modernes qui gèrent cela de façon bien plus souple ? BTRFS, et surtout ZFS…

Je ne suis pas forcément fan des trucs qui font tout en un seul bloc, sans forcément pour autant avoir de raison objective à donner. J’ai l’impression que ça risque de faire tout pas forcément bien, et qu’en cas de problème je ne pourrai rien faire d’autre face à un truc aussi compliqué que lancer l’outil de réparation en priant, alors que m’attaquer à la couche plus simple qui déconne me paraîtrait plus faisable. On peut par exemple faire des trucs avec mdadm pour récupérer un RAID en étant sûr d’être non destructif, et on peut éventuellement aussi s’aider d’un éditeur hexa.

Pour cette raison je n’ai jamais voulu toucher à l’équivalent Windows de LVM et RAID (en plus que ce soit proprio), je ne sais juste pas du tout ce qu’il fait, alors que sur un RAID5 je comprends mieux ce qui se passe, même si les détails d’implémentation vont varier d’un contrôleur à l’autre.

Je suis en train de me construire un NAS Linux, et je pensais partir sur du mdadm + LUKS + btrfs/zfs, ce qui me permet quand-même de profiter de la plupart des fonctionnalités de btrfs/zfs. Cependant, après lecture de ton billet (merci d’ailleurs), je ferai des tests avec ZFS seul pour comparer et voir un peu comment ça marche.

Quand on y goute, le RAID 0, 1, 0+1, 5, 6 ou 10 semble d’un autre age !

Je dirais plutôt que c’est différent, c’est l’éternel débat monolithique vs modulaire qui s’applique partout en informatique.

Et sinon, quelqu’un aurait un petit avis comparatif à donner entre BTRFS et ZFS ?

CR_B7 Abonné

Le 04/08/2022 à 18h 54

#40

ragoutoutou a dit:

La licence est une chose, l’entreprise en est une autre… s’il faut critiquer une entreprise à l’heure actuelle, c’est Canonical qui s’obstine en maintenant son approche consistant à livrer le pilote binaire directement et qui crée une situation affaiblissant la licence du kernel. Pour le coup Oracle n’y est pour rien, le seul reproche qu’on pourrait leur faire c’est leur choix de licence pour leur logiciel, mais cela ne serait pas très correct pour le coup, mais ce n’est pas très pertinent face à Canonical qui méprise les techniques standard pour résoudre le problème en faveur d’une approche contraire à la licence GPL2.

Tu noteras que c’est linus thorvalds, qui demande de ne pas l’utiliser.
Pas canonical…

fdorin Abonné

Le 04/08/2022 à 19h 32

#41

patos a dit:

En pleine journée, une base de données de production à restaurer, c’est que la production est arrêtée ! Et ça ça ne doit pas arriver, ça coût des dizaines de milliers d’euros par heure sans…. (si ce n’est plus)

A un tel niveau d’impact, si une haute disponibilité n’a pas été mise en place, c’est qu’il y a un problème bien en amont dans le PCA et/ou PRA.

Inodemus Abonné

Le 04/08/2022 à 20h 25

#42

patos a dit:

Le problème c’est la seconde erreur: celle qui suit celle qui n’a pas été prévisible.

2 disques en erreur sur le même secteur c’est extrêmement improbable (on parle toujours des erreurs de lecture tous les 10^14 ?).

Si le problème apparait dans une section de données critiques, c’est le logiciel qui se plante. Un Windows qui râle, on s’en fout. Une base de données qui se crashe, c’est pas la même… En pleine journée, une base de données de production à restaurer, c’est que la production est arrêtée ! Et ça ça ne doit pas arriver, ça coût des dizaines de milliers d’euros par heure sans…. (si ce n’est plus)

Ah ben oui, dans cette situation il ne faut pas faire du RAID5. Mais de là à dire que le RAID5 est à bannir sans préciser le moindre contexte, c’est un peu exagéré.

patos Abonné

Le 05/08/2022 à 07h 20

#42.1

Je ne parle pas “predictive failure” qui est le meilleur des cas. Je parle décès de disque, point.
Ton disque meurt (100% inaccessible), une reconstruction qui se déclenche puis une erreur de tête (10^14) dans une donnée critique lors de la reconstruction. Ben tu l’as dans le cul. La probabilité est donc de la lecture uniquement, puisque l’autre disque est déjà mort. Ca s’appelle avoir les fesses qui claquent pendant la reconstruction.

Et exagéré…. Tu verras bien le jour où t’y auras droit…

ragoutoutou Abonné

Le 04/08/2022 à 23h 24

#43

CR_B7 a dit:

Tu noteras que c’est linus thorvalds, qui demande de ne pas l’utiliser. Pas canonical…

Linus Torvalds a demandé de ne pas l’utiliser avec linux( ce qui est à mon sens un peu abusif), et a rappelé l’évidence de l’incompatibilité de la licence pour intégrer ZFS officiellement au noyau …

La FSF et la Software Freedom Conservancy on demandé de ne pas distribuer le pilote binaire précompilé (une approche DKMS n’aurait pas posé de problème de licence du tout)… Canonical n’en a rien eu a cirer et a préféré surfer sur une interprétation assez “originale” de la licence GPL soutenant que l’accès au code sous une autre licence que GPL est suffisant pour fournir les binaires sous GPL.

Au final on est juste dans un flou qui, s’il perdure pourrait créer un précédent qui affaiblirait les licences GPL2 et 3 ainsi que leurs dérivés, ce qui est très mauvais pour l’écosystème du libre.

On peut aussi supposer que si ni la Linux Foundation ni la SFC n’ont attaqué Canonical en justice, c’est peut-être par peur que ce contournement de licence ne soit acté comme valide devant un tribunal.

Bref on a peut-être besoin d’une GPL4, mais dans ce cas, le noyau linux, qui est coincé éternellement en version 2, n’en bénéficiera et restera vulnérable.

Inodemus Abonné

Le 05/08/2022 à 09h 51

#44

patos a dit:

Je ne parle pas “predictive failure” qui est le meilleur des cas. Je parle décès de disque, point. Ton disque meurt (100% inaccessible), une reconstruction qui se déclenche puis une erreur de tête (10^14) dans une donnée critique lors de la reconstruction. Ben tu l’as dans le cul.

Tu l’as dans le cul pour cette donnée, pas pour tout le RAID si le contrôleur est bien fait. OK ça peut faire des dégâts suivant l’importance de cette donnée, mais c’est une question de contexte après, comme je l’ai dit on ne fait pas du RAID5 quand c’est hyper-uber-méga-important-et-cher de ne rien perdre.

Par ailleurs le RAID reste en ligne même si la reconstruction échoue à cause d’une erreur de lecture, on peut toujours copier tout le reste ailleurs.

Et exagéré…. Tu verras bien le jour où t’y auras droit…

C’est exagéré de généraliser à tous les contextes, perdre un secteur sur mon RAID5 une fois tous les 10 ans (à la louche, car pour l’instant je n’ai rien perdu) me fera plus ou moins chier mais ne me changera pas la vie et ne me coûtera pas cher, et j’ai plein de données de grande taille mais facilement retrouvables, donc dans mon contexte, c’est adapté. Quelqu’un d’autre l’a dit, on choisit ses solutions de stockage en fonction de l’importance des données.

Et la double panne, j’ai déjà eu, sur un RAID5 tout neuf, un disque qui meurt puis un autre (totalement morts, pas des erreurs de lecture). Je les stresse au début pour voir s’il n’y a pas une faiblesse déjà présente à l’achat, donc je n’avais pas encore de réelle donnée dessus.

Stockage : c’est quoi un RAID et comment ça marche

RAID is dead

Le RAID en quelques mots

C’est quoi une grappe ?

Vocabulaire : avez-vous les bases ?

RAID 0 = 0 sécurité, mais de bonnes performances

RAID 1 : à vous de décider du niveau de tolérance de panne

RAID 5 : un compromis, avec trois disques minimum

Tiens, en parlant de ça :

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Plus moins bien

Transhumanisme, long-termisme… des idéologies aux racines eugénistes ?

Science artificielle

Corrigée depuis deux ans, une faille Windows activement exploitée par des pirates russes

Faille 1460-days

Sommaire de l'article

Introduction

Le RAID en quelques mots

C’est quoi une grappe ?

Vocabulaire : avez-vous les bases ?

RAID 0 = 0 sécurité, mais de bonnes performances

RAID 1 : à vous de décider du niveau de tolérance de panne

RAID 5 : un compromis, avec trois disques minimum

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Transhumanisme, long-termisme… des idéologies aux racines eugénistes ?

Corrigée depuis deux ans, une faille Windows activement exploitée par des pirates russes

La CNIL fait le bilan de son année 2023, cinquième année après RGPD

#LeBrief : TikTok suspend sa version Lite, Ariane 6 debout, enquête sur Pegasus, l’Europe et la violence numérique aux femmes

Terrorgram, la fabrique de terroristes d’extrême-droite, à coups de mèmes et de shitposts

Fiabilité des disques durs HAMR de 30 To et plus : Seagate donne des chiffres

[Màj] Le Congrès des États-Unis vote la loi obligeant ByteDance à vendre TikTok

#LeBrief : Fedora 40, anniversaire Hubble, vidéosurveillance algorithmique à Cannes, Voyager 1, Android 15 bêta 1.1

Sur GitHub et GitLab, des commentaires détournés pour stocker des malwares

[FAQ] Notre antisèche sur l’informatique quantique

L’Université d’Oxford ferme le Future of Humanity Institute dirigé par Nick Bostrom

#LeBrief : Apple rachète le français Datakalab (IA), propagande de la Russie, fin de partie pour Roccat, Proton Mail vs dark web

Europol milite pour un chiffrement de bout en bout « flexible »

Inclusion dans la tech : critiqué, le CEO de Qovery menace une internaute de poursuites

L’extension des prestataires américains devant collaborer avec la NSA fait polémique

#LeBrief : fuite chez Speedy, Rust pour Thunderbird, Saint Exupéry et PhiFire AI pour le satellite Φsat-2

Des institutions internationales s’engagent pour l’ouverture des données sur la recherche

#Flock craque le slip et explose les quotas

[Édito] Au pays des VPN menteurs…

Les clients LastPass victimes d’une attaque par phishing orchestrée grâce à un kit clé en main

Les recommandations de la NSA pour « déployer des systèmes d’IA en toute sécurité »

#LeBrief : Windows Store amélioré, 28 licenciements chez Google, sécurité des données des français, compétition 404CTF

Batterie de nouveautés pour Dropbox, dont le chiffrement de bout en bout pour les équipes

TikTok suspend le système de récompense de sa version Lite

L’Union européenne se dote d’une directive sur les violences numériques faites aux femmes

L’Espagne relance son enquête sur le logiciel espion Pegasus, avec l’aide de la France

Ariane 6 : le corps central se tient debout sur la rampe de lancement

Commentaires (66)