Lead
La préservation des données numériques a donné lieu à de nombreuses études. Néanmoins, plusieurs problèmes fondamentaux restent ouverts, en particulier dans le contexte du stockage de données redondantes. Un système fiable doit d’une part garantir la disponibilité des données même en présence de pannes temporaires, et d’autre part offrir des mécanismes de réparation pour récupérer les données après les pannes permanentes. Les méthodes actuelles entrainent une importante consommation de ressources. Nous avons récemment proposé une nouvelle méthode basée sur l'enchevêtrement de données dans le but d’offrir des niveaux élevés de tolérance aux pannes tout en utilisant efficacement les ressources du système. Cette méthode peut être utilisée comme mécanisme intégré de génération de redondance. Ce projet vise à acquérir une meilleure compréhension de la façon d'intégrer les mécanismes d'enchevêtrement dans certains systèmes de stockage largement répandus.

Lay summary

L'objectif principal est d'évaluer de nouvelles techniques de fiabilité basées sur l'enchevêtrement des données. Notre recherche se concentre sur les codes hélicoïdales d'enchevêtrement (HEC), une technique qui se fonde sur deux idées. Tout d'abord, le système crée des interdépendances entre les données stockées dans différents dispositifs de stockage afin de générer des informations redondantes. Deuxièmement, le système propage efficacement ces redondances parmi un grand nombre de dispositifs de stockage. En outre, le système offre plusieures manière de reconstruire des données perdues après des pannes en utilisant le contenu qui a survécu. L’enchevêtrement de données est une solution prometteuse pour augmenter la tolérance aux pannes, et donc pour améliorer la durabilité et la disponibilité des données. Nous prévoyons dans ce projet de consolider les principes de fonctionnement de HEC et de valider les idées sous-jacentes. Cette collaboration devrait aboutir à des simulations plus détaillées, ainsi qu’à la mise en œuvre d'un prototype de codes d'enchevêtrement. Nous prévoyons de publier nos résultats dans 1-2 articles scientifiques.

Les méthodes classiques pour le stockage de données redondantes ne peuvent pas tolérer un nombre de défaillances simultanées supérieur au nombre de copies. Or, la création et le stockage de données redondantes nécessite beaucoup de ressources. Plusieurs approches basées sur des techniques de codage et permettant de limiter ces ressources ont été récemment développées. Pour la plupart d’entre elles, les compromis en termes de stockage, de bande passante du réseau et d'autres ressources limitent la capacité du système à tolérer plus de pannes. D'autres ont donné lieu à des avancées de nature uniquement théorique. Notre recherche offre une solution qui prend en compte plusieurs aspects pratiques et, par conséquent, pourrait être considérée comme une solution concrète pour les applications de stockage déployées dans des systèmes réels.