April 29, 2024

PDFS

C'est en forgeant qu'on devient forgeron

Quand l’archivage des données à long terme signifie « pour toujours »

4 min read

Tout d’abord, l’archivage à long terme des données pendant des décennies n’est pas aussi simple que le chargement de bandes ou d’autres supports de stockage.

“Il y a beaucoup de pré-planification nécessaire”, a déclaré Ramin Yahyapour, professeur et CIO à l’Université de Göttingen en Allemagne. « Il ne suffit pas de l’archiver. »

Avoir des partenaires pour fournir des outils est important pour l’archivage des données à long terme, a déclaré Yahyapour, qui est également directeur général de GWDG, un centre de services de traitement de données pour l’Université de Göttingen. Le centre de services utilise Quantum pour gérer 60 Po de données, dont certaines doivent être conservées pour toujours.

Mise en œuvre et enjeux de l’archive « pour toujours »

« Le code de conduite pour la recherche financée par les fonds publics en Allemagne exige désormais au moins 10 ans d’archivage des données pour assurer la reproductibilité de la recherche », a déclaré Yahyapour. “Cependant, nous avons beaucoup d’ensembles de données qui sont considérés comme un patrimoine culturel et non remplaçables. En tant que tels, nous préservons et conservons ces données dans une perspective” éternelle “.”

Le GWDG, qui fournit le back-end d’archivage pour plusieurs institutions, a collecté des échantillons historiques des sciences sociales et naturelles. Certains animaux, plantes et langues n’existent plus et, par conséquent, ne peuvent pas être recréés, a déclaré Yahyapour. Par exemple, les sons d’un oiseau disparu devraient rester dans les archives pour toujours.

Les livres et autres artefacts appartiennent également à la catégorie « pour toujours ». La bibliothèque d’État et universitaire de Göttingen a pour mission de préserver et de collecter des objets du XVIIe siècle. La bibliothèque vise à numériser ces livres du 17ème siècle – c’est beaucoup de texte.

Ramin YahyapourRamin Yahyapour

Yahyapour a déclaré qu’il estimait que son organisation gère environ 5 Po de données dans les archives “pour toujours”. Ces données font partie des 20 PB dans un Archive sur bande quantique. Le GWDG dispose de 25 Po dans le système de fichiers Quantum StorNext, qui comprend l’archive sur bande.

La bande est sûre mais a un accès lent. Yahyapour a déclaré qu’il utilise également un stockage sur disque, ce qui permet une réutilisation plus facile des données.

Cependant, la plupart des données d’archives à long terme ne sont jamais consultées. Par conséquent, les politiques de localisation des données sont importantes.

Il existe d’autres défis importants à l’archivage des données à long terme.

Le GWDG, qui a été fondé en 1970 et assure un service d’archivage depuis 40 ans, a constamment besoin de renouveler son architecture et migrer les données. Elle utilise Quantum depuis près de 15 ans et a renouvelé ses bibliothèques il y a environ deux ans. Les bandes ont une durée de vie de 20 à 30 ans, mais la technologie pour les gérer dure généralement de huit à 10 ans, a déclaré Yahyapour.

Tout le temps, vous pensez à la prochaine migration. C’est une mission à long terme.

Ramin YahyapourProfesseur et CIO, Université de Göttingen

La migration de toutes les données peut prendre deux ans.

“C’est un travail assez complexe”, a déclaré Yahyapour. “Tout le temps, vous pensez à la prochaine migration. C’est une mission à long terme.”

Un processus d’archivage de données à long terme doit également prendre en compte les formats de fichiers. « Pouvez-vous toujours lire votre fichier Microsoft Word de 1995 ? » dit Yahyapour.

Les outils pour travailler avec les fichiers et gérer l’évolution des formats de fichiers sont utiles.

C’est beaucoup d’efforts, mais cela en vaut la peine, a déclaré Yahyapour, car l’archivage à long terme a été un succès, sans perte de données.

« Pensez différemment » à propos de l’archivage

L’archivage des données à long terme est devenu une préoccupation pour les clients, tels que les organisations des sciences de la vie, des médias et du divertissement, a déclaré Eric Bassier, directeur principal du marketing produit chez Quantum, qui est basé à San Jose, en Californie. Par exemple, les médias et les organisations de divertissement voudront probablement conserver des copies originales de certains films et moments sportifs.

“Nous constatons que ces entreprises veulent conserver ces ensembles de données pour toujours”, a déclaré Bassier.

Stockage d’objets va être une technologie critique pour ces archives. Les objets sont plus faciles à rechercher, à accéder et à réutiliser, a déclaré Bassier.

Le ruban jouera également un rôle clé. Les bandes coûtent moins cher par rapport à d’autres supports, consomment peu d’énergie et ont une longue durée de vie.

L’archivage des données à long terme nécessitera un logiciel intelligent qui connaît les emplacements de stockage et peut faire des copies vers la prochaine génération, a déclaré Bassier.

L’éducation est également importante. Quantum a commencé à faire passer le message sur ce nouveau défi.

“C’est une façon différente de penser à l’archivage ou à la création d’archives”, a déclaré Bassier.

Leave a Reply

Your email address will not be published. Required fields are marked *