Bienvenue sur le catalogue des solutions Arkeia

Déduplication progressive, à la source d'Arkeia

La technologie de "déduplication progressive » Arkeia s'effectue à la source, à la volée, et s'ajuste en fonction du contenu. Elle  se différencie des approches de déduplication précédentes basées sur des blocs variables ou fixes.

Deduplication Déduplication à blocs fixes ou variables

La technologie de déduplication progressive allie les avantages des deux approches précédentes. Elle offre la performance de la déduplication basée sur des blocs fixes ainsi que la gestion de l'insertion de données que permet la déduplication basée sur des blocs variables. La technologie du "sliding window" utilisée par la déduplication progressive a déjà été employée par de nombreux algorithmes de compression. L'innovation clef de Kadena consiste à introduire la technologie brevetée de "comparaison progressive", dont vous trouverez les détails ci-dessous.

Progressive matchingDéduplication progressive : plus de rapidité pour des fenêtres de 

La déduplication progressive améliore la traditionnelle déduplication à blocs variables à deux niveaux. Tout d'abord, la déduplication progressive est plus rapide, ce qui réduit la longueur des fenêtres de sauvegardes. De plus, la déduplication progressive Arkeia élimine le besoin de rechercher une limite à chaque bloc.

Tous les fichiers déjà répertoriés par Arkeia sont dédupliqués à la vitesse de la technologie à blocs fixes. Les nouvelles données sont analysées avec la « sliding-window » ; un algorithme rapide et léger détermine si les données de la fenêtre sont susceptibles de coïncider avec des blocs déjà connus.

Les blocs potentiellement existants sont validés par un algorithme de hachage ultra performant. Du fait que plus de 99% des blocs potentiellement similaires le sont vraiment, la comparaison progressive est extrêmement efficace. La technologie brevetée de « comparaison progressive » Arkeia a d'ailleurs inspiré l'appellation de « déduplication progressive ».

Déduplication progressive : des ratios de compression plus élevés pour un espace de stockage et un trafic réseau réduits

Le deuxième avantage de la déduplication progressive se situe au niveau de l'obtention de ratios de compression plus élevés permettant de réaliser des économies non seulement en termes d'espace de stockage mais aussi en utilisation de la bande passante réseau. Transférer moins de données sur le réseau accélère également les sauvegardes.

La déduplication par blocs variables fixe les limites des blocs de façon aléatoire, ne permettant qu'un très faible contrôle sur la taille des blocs. La déduplication progressive en revanche évalue toutes les limites

de blocs possibles et garantit ainsi la meilleure déduplication possible.

De plus, étant donné que la taille du "sliding window" peut être ajustée, la taille des blocs peut être adaptée au type de fichiers à dédupliquer. Ceci permet une adaptation de la déduplication par rapport au contenu du fichier. Afin d'obtenir les meilleurs ratios de déduplication possible, Arkeia utilise une taille de blocs optimale pour chaque type de fichier. Chaque type de données, telles que les fichiers exécutables, les fichiers textes, et les bases de données, seront dédupliquées selon la taille du bloc qui permettra de réaliser le taux de compression maximum.

Arkeia a analysé des centaines de types de fichiers produits par des centaines d'applications courantes au sein des entreprises, afin de déterminer la taille de bloc optimale de chacun. Les administrateurs ont la possibilité d'effacer des tailles de blocs par défaut et de spécifier de nouvelles tailles de blocs pour des nouveaux types de fichiers.

GraphLes taux de déduplication dépendent fortement des données à dédupliquer, mais peuvent atteindre une réduction du volume des données allant jusqu'à 95% dans les cas où un même fichier est sauvegardé plusieurs fois (comme des sauvegardes nocturnes pendant un mois) ou lors de la sauvegarde de plusieurs volumes de données similaires (comme la sauvegarde de multiples machines virtuelles VMware à travers plusieurs machines host physiques).

La réplication des données dédupliquées

En combinant la déduplication avec la technologie de réplication des sauvegardes Arkeia, les utilisateurs Arkeia seront encore mieux équipés pour la protection de leurs environnements WAN distribués. Les données sont répliquées dans leur forme dédupliquée vers un site distant équipé du Disaster Recovery Arkeia en utilisant une bande passante réduite et libérant ainsi le réseau pour d'autres processus. Comme seuls les blocs non encore connus par le site équipé du Disaster Recovery sont transférés via le WAN, les sauvegardes sont effectuées en un minimum de temps. Les environnements de sauvegarde qui avaient traditionnellement besoin de bandes pour la protection de données hors site, peuvent maintenant bénéficier de l'efficacité et la réduction des coûts grâce aux transferts via le WAN.

Vous avez plus de questions sur la déduplication en général et la déduplication progressive en particulier ? Consultez notre FAQ