April 29, 2024

PDFS

C'est en forgeant qu'on devient forgeron

Le stockage ADN promet une augmentation de 10 millions de capacité de stockage

6 min read

Suggérez à un directeur de l’information qu’ils pourraient bientôt stocker 10 millions de fois plus de données comme la capacité d’un seul disque dur, et à tout le moins, ils sont susceptibles d’être sceptiques.

Mais de telles avancées pourraient être possibles – et dans les prochaines années. La raison est Stockage d’ADN. Au lieu d’utiliser des disques durs, des bandes magnétiques ou des mémoires flash, le stockage ADN conserve les données en utilisant le code de la vie lui-même.

Avec la science d’aujourd’hui, un système de stockage d’ADN peut contenir 10 zettaoctets de données dans un appareil de la taille d’une boîte à chaussures, selon John Monroe, vice-président et analyste du chercheur industriel Gartner. «Ces beaux codes à quatre lettres pourraient être le moyen idéal pour stocker des données numériques», dit-il. “C’est énorme en termes de capacité – il est plus prometteur que tout autre format de stockage d’archives.”

Les chercheurs estiment que les données stockées dans l’ADN pourraient durer entre 700 000 et un million d’années, bien au-delà de la durée de vie de toute technologie de stockage actuelle. Monroe voit le stockage ADN remplacer les bandes ou les lecteurs optiques pour près de la ligne ou stockage hors ligne.

L’ADN lui-même est extrêmement robuste, capable de résister à la chaleur et au froid. Et une fois que l’information a été encodée et synthétisée en ADN – la phase « d’écriture » ​​– elle n’a besoin d’aucune alimentation pour la maintenir dans cet état. Le séquençage et le décodage de l’ADN, la phase de « lecture », reconvertissent le code nucléotidique à quatre lettres de l’ADN en une forme qu’un ordinateur peut traiter.

Mais malgré cette promesse, l’idée est encore loin d’être une technologie pratique. L’industrie informatique n’a pas encore mis au point de dispositifs de stockage d’ADN utilisables à l’échelle de la production. « Les gens ont encore du mal à voir à quoi cela ressemble », admet Monroe.

Il pense que l’équipement aura la taille d’un appareil de cuisine ; d’autres prédisent qu’il pourrait avoir la taille d’un autobus scolaire. Microsoft a déjà développé une machine de codage et de récupération d’ADN de taille plus pratique, avec l’Université de Washington. Cependant, il s’agit toujours d’un prototype et non d’un élément qu’un service informatique pourrait simplement insérer dans un rack informatique 19U existant.

Romance chimique

Cependant, le codage et le séquençage actuels de l’ADN sont encore en grande partie un processus chimique. C’est la raison pour laquelle le prototype de Microsoft et de l’Université de Washington ressemble plus à quelque chose que vous pourriez trouver dans un laboratoire scientifique scolaire qu’à un centre de données. Et le processus est actuellement coûteux.

Le séquençage de 1 Mo de données coûte environ 3 500 $ (2 500 £). Et bien que les coûts diminuent, c’est bien plus que le coût d’écriture du même volume de données sur flash ou sur disque. Gartner pense que la technologie ne se généralisera pas tant que le coût ne tombera pas à environ 0,01 $ par gigaoctet.

Les technologies alternatives incluent la synthèse d’ADN enzymatique (EDS), qui est développée par le Institut Wyss, qui fait partie de l’Université Harvard. Les chercheurs pensent que cela réduira le coût de la synthèse d’ADN de plusieurs ordres de grandeur. L’équipe de Wyss développe un appareil électronique capable de synthétiser des données en ADN. Ils pensent que cela augmentera le processus en permettant de paralléliser le processus de synthèse.

Les chercheurs, cependant, sont convaincus que les obstacles financiers et pratiques seront surmontés, ne serait-ce que parce que peu de technologies, voire aucune, offrent le potentiel de stocker les vastes quantités de données qui peuvent être stockées dans l’ADN.

Sans surprise, les gouvernements et les agences de renseignement sont à l’origine d’une grande partie de l’intérêt pour le stockage de l’ADN. Aux États-Unis, le Intelligence Advanced Research Projects Activity (IARPA), qui fait partie du bureau du directeur du renseignement national, gère MIST, le programme de stockage d’informations moléculaires, qui est chargé d’écrire un téraoctet et de lire 10 téraoctets de données en 24 heures pour un coût de 1 000 $.

D’autres chercheurs, du Laboratoire national de Los Alamos, sont financés par l’IARPA pour travailler sur des systèmes permettant de traduire les informations ADN en code lisible par ordinateur. Leur système, ADS Codex, gère le codage et le décodage en binaire, indépendamment de la méthode utilisée pour la synthèse de l’ADN elle-même.

En outre, ADS Codex fournit une correction d’erreur avancée. Les erreurs d’écriture sont plus élevées dans le stockage d’ADN que dans le stockage numérique conventionnel, un problème aggravé par le fait que l’ADN a quatre états de lettres, plutôt que des zéros et des uns binaires. ADS Codex vérifie les données et supprime les erreurs. Le code est disponible sur GitHub.

L’Europe a elle aussi apporté sa contribution dans ce domaine. Le projet européen DNA DS, coordonné par des chercheurs slovènes, envisage de stocker 450 pétaoctets de données dans une seule molécule. Potentiellement, un datacenter entier pourrait tenir dans un seul flacon de liquide. Les chercheurs ont également examiné un autre avantage du stockage de l’ADN. Bien que l’écriture des données sur l’ADN reste lente, même un flacon plein peut être répliqué en quelques heures à peine, presque sans frais et en utilisant peu d’énergie.

Alliance technologique

Maintenant que les chercheurs universitaires ont prouvé que le stockage de l’ADN est possible, l’accent est mis sur les aspects pratiques.

En 2020, un groupe de poids lourds de l’industrie informatique, dont Microsoft et Western Digital, a formé la DNA Data Storage Alliance avec les sociétés de biotechnologie Twist Bioscience et Illumina, et des chercheurs universitaires.

L’objectif est de créer un écosystème viable autour du stockage de l’ADN, Microsoft et d’autres soulignant que le domaine évolue de la recherche universitaire et scientifique vers des applications pratiques de stockage de données pour l’informatique. L’application la plus attrayante, du moins au début, concerne les données de stockage à froid qui sont écrites une fois et lues rarement.

D’autres applications incluent les médias. L’année dernière, Twist a encodé – de manière assez appropriée – un épisode de la série Netflix Biohackers à l’ADN. Être capable d’enregistrer efficacement des quantités illimitées de données, de les stocker indéfiniment et de les répliquer rapidement, pourrait convenir au cinéma et à d’autres industries créatives.

D’autres applications potentielles incluent le stockage de données médicales et l’archivage légal et de conformité.

Cela pose cependant quelques autres problèmes, qui concernent autant les normes que la technologie. “Pour des données telles que WORM – écrire une fois, lire plusieurs – ou WORN – écrire une fois, lire jamais – il est important que les données soient immuables”, prévient Monroe de Gartner. “Vous devez savoir que ce que vous écrivez, disons une image d’un cerveau aujourd’hui, sera exactement le même dans 10 ans.”

Si les chercheurs peuvent s’assurer que c’est le cas, alors la double hélice de la vie pourrait encore émerger comme le meilleur moyen de stocker nos données dans un avenir lointain.

Leave a Reply

Your email address will not be published. Required fields are marked *