● Cette innovation permet d’organiser, stocker et accéder à des données dans un volume microscopique. Elle repose en préalable sur l’encodage binaire en séquences nucléotidiques avec une densité inégalée par les supports silicium actuels.
● Malgré son potentiel pour l’archivage, cette technologie se heurte à des contraintes majeures : débit de lecture lent et coûts prohibitifs pour un usage grand public.
Et s’il était possible de stocker des millions de vidéos dans une simple cassette ? Dans une étude publiée dans la revue Science Advances, des chercheurs décrivent comment ils ont fabriqué une cassette, similaire aux vieilles cassettes audios, qui permet de stocker des données sur ADN. Ce système inclut également un lecteur de cassette ADN, qui peut réaliser différentes opérations comme l’adressage, l’encapsulation, la décapsulation, la récupération et la réécriture de fichiers. Les tests ont montré qu’il était possible de déposer puis relire plusieurs images, restituées sans perte après 50 minutes de manipulation. Ce type d’innovation semble porteur pour répondre à une crise croissante du stockage due au volume croissant de données générées par l’IA, mais en réalité, le stockage sur ADN profitera davantage aux professionnels de l’archivage.
Le stockage sur ADN ne peut pas répondre à la demande massive de stockage que l’on connaît actuellement
Le stockage sur ADN, comment ça marche ?
« Quand on parle de stockage sur ADN, il s’agit d’ADN synthétique, pas d’ADN humain. L’ADN est fondamentalement une suite de quatre molécules représentées par les lettres A, G, C et T. Cette séquence encode naturellement l’information génétique, mais peut également être utilisée pour encoder d’autres types d’informations comme du texte, de la voix ou des films, explique Jean Bolot, conseiller scientifique chez Orange. Le principe est de synthétiser une chaîne de molécules qui va représenter l’information que l’on souhaite coder. Par exemple, si l’on veut encoder une conversation, on va d’abord la transformer en une séquence de bits, comme on le fait habituellement pour le stockage numérique. Mais au lieu d’utiliser un alphabet binaire (0 et 1), on va l’exprimer sous forme d’une séquence des quatre lettres A, C, T et G. « On va ensuite synthétiser cette suite de molécule et l’assembler pour créer un brin d’ADN qui représente l’information qu’on veut stocker. »
Une approche trop chronophage pour remplacer les méthodes actuelles
Encoder des informations sur l’ADN est très chronophage, souligne Jean Bolot : « Il n’y a pas de solution miracle : on synthétise seulement quelques molécules par seconde, ce qui équivaut à quelques kbits par seconde, et ce avec une forte latence. En d’autres termes, le stockage sur ADN ne peut pas répondre à la demande massive de stockage que l’on connaît actuellement. Il est plus adapté à l’archivage qu’aux besoins d’accès aux données immédiats. » Pour lire les informations stockées sur ADN, il existe plusieurs techniques. « L’une d’elles s’appelle nanopore. On fait passer le brin d’ADN dans un petit trou entouré de cellules et lorsqu’on tire le brin à travers ce trou, chaque molécule génère un courant électrique dans les cellules environnantes, et l’intensité de ce courant varie selon le type de molécule. En mesurant ces variations de courant, on peut déterminer la séquence d’ADN. On peut atteindre quelques mégabits par seconde dans les meilleures conditions. »
Il précise que « la cassette dont parle l’article n’est pas une nouvelle méthode de stockage, mais plutôt une façon d’indexer les informations stockées ». De fait, si l’on stocke un million de films, il faut être capable de les retrouver. « Il faut un mécanisme d’indexation des brins d’ADN et un système de recherche qui permet de trouver les brins appropriés. L’article traite donc davantage de la mécanique de recherche d’information que du processus de stockage ou de lecture en lui-même. »
Un outil d’archivage presque illimité
Ainsi le stockage sur ADN peut répondre au besoin des studios de cinéma d’archiver leurs films historiques – on parle de millions de films – qui sont aujourd’hui enregistrés sur des supports qui sont en train de se détériorer. « De plus, les solutions de stockage classiques nécessitent de l’énergie pour l’électricité, le refroidissement et les mises à jour, ce qui est coûteux pour de grandes masses de données. » Outre sa durabilité de quelques dizaines voire centaines de milliers d’années, l’ADN permet un stockage beaucoup plus dense. « Dans un cube de quelques centimètres carrés, on peut théoriquement stocker tous les films produits dans l’histoire de l’humanité », et ce à température ambiante.
