Calcul partagé : mettre son PC au service de la lutte contre les maladies

Diviser une quantité de travail informatique en unités réparties sur des milliers d’ordinateurs mis à disposition par des volontaires : ce modèle, qui permet d’atteindre des puissances de calcul phénoménales, contribue à faire progresser les connaissances scientifiques. Dans le domaine médical, par exemple, il a entraîné un bon en avant considérable dans la science des protéines, indispensable pour lutter contre le sida, la maladie d’Alzheimer, le virus Ebola et plus récemment la Covid-19.

“Grâce à une mobilisation massive de milliers d’internautes et d’organisations, Folding@Home a dépassé le seuil symbolique de l’exaFLOPS.”

En mars 2020, le projet de calcul distribué Folding@Home dépasse le seuil symbolique de l’exaFLOPS et atteint une puissance de calcul supérieure à celle d’IBM Summit, alors le plus puissant supercalculateur (dépassé depuis par le Fugaku de Fujitsu). Cet exploit a été rendu possible par la mobilisation de milliers d’internautes, d’entreprises et d’institutions publiques, qui ont décidé de partager les ressources de leurs ordinateurs, dans le cadre de la pandémie de Covid-19, pour permettre la modélisation des protéines responsables de la maladie et accélérer la découverte d’un traitement.

La recherche scientifique nécessite une puissance de calcul phénoménale pour effectuer des simulations de plus en plus complexes, indispensables pour résoudre d’importants problèmes dans différentes disciplines. Mais les chercheurs ne disposent pas toujours des moyens financiers qui leur permettraient d’utiliser un supercalculateur.

En “distribuant” une opération informatique sur des milliers d’ordinateurs personnels connectés à Internet, le calcul partagé fonctionne comme un ordinateur virtuel surpuissant capable de résoudre d’importants calculs qui nécessiteraient des temps très longs dans un environnement classique. Les utilisateurs téléchargent et installent un logiciel sur leurs machines. Ce logiciel fonctionne en arrière-plan en utilisant uniquement les ressources disponibles et inutilisées pour exécuter les tâches de calcul, et envoie ensuite les résultats à la source. La plupart du temps, chaque utilisateur peut choisir le(s) projet(s) auquel il souhaite participer.

De la recherche de signes de vie extraterrestre…

Le pionnier en la matière est le projet SETI@home, développé par l’université de Berkeley, en Californie, en collaboration avec le programme SETI (Search for Extra-Terrestrial Intelligence). Lancé en 1999, il poursuivait deux objectifs : prouver la viabilité du calcul distribué d’une part, détecter la présence de vie extraterrestre en analysant les données fournies par le radiotélescope d’Arecibo (sur l’île de Porto Rico) afin d’y déceler un signal d’autre part.

Seul le premier objectif a été atteint. SETI@home a prouvé à la communauté scientifique que le calcul distribué permettait d’obtenir une puissance de calcul qui pouvait rivaliser avec les superordinateurs les plus puissants. 

La plateforme BOINC, qui supporte le logiciel depuis 2005, soutient aujourd’hui plusieurs projets de calcul distribué dans un vaste éventail de disciplines : biologie et médecine, physique et nanotechnologies, astronomie, climatologie, mathématiques et informatique. Elle rassemble une importante communauté d’utilisateurs et atteint une puissance totale moyenne de calcul de plus de 33 pétaflops repartie sur environ 550.000 ordinateurs.

En 2019, les deux projets les plus populaires sur la plateforme étaient Collatz Conjecture, visant à réfuter l’énoncé éponyme en testant des suites mathématiques, et Einstein@Home, destiné à détecter des ondes gravitationnelles en analysant les données des interféromètres. 

… à la lutte contre les maladies

En parallèle, BOINC est utilisé dans le projet World Community Grid (WCG). Créé en partenariat avec IBM en 2004, WCG regroupe plusieurs projets de recherche scientifique ayant un fort intérêt humanitaire – lutte contre le sida ou le virus Ebola, étude du climat, recherche de nouveaux matériaux dans le domaine des énergies renouvelables, etc. – dans une grille de calcul unique (les utilisateurs sont inclus dans tous les projets par défaut).

Parmi ces projets, le Décrypthon a permis de faire progresser la compréhension des maladies génétiques et des maladies rares. Lancé lors du Téléthon 2001 par l’Association française contre les myopathies (AFM) et IBM, le projet visait à produire une cartographie du protéome (l’ensemble des protéines exprimées dans une cellule), mise à la disposition des chercheurs. 75.000 internautes se sont mobilisés.

Chaque ordinateur a contribué à hauteur d’environ 133 heures, soit plus de 10 millions dheures de calcul au total. 550 000 protéines du monde vivant ont été répertoriées. Il aurait fallu plus de 1.170 années pour réaliser cela à l’aide d’un seul ordinateur. Par la suite, une dizaine de projets scientifiques sélectionnés par appel d’offres ont été menés dans le cadre du programme Décrypthon.

Toujours dans le domaine de la recherche sur les protéines, Folding@Home, fondé en 2000 par Vijay S. Pande à l’université Stanford, en Californie, veut faire avancer la compréhension du repliement des protéines en simulant ce processus dans diverses conditions. Le but est d’en tirer des connaissances utiles pouvant notamment permettre de développer de nouveaux médicaments contre plusieurs maladies, comme la maladie d’Alzheimer et certains types de cancers. Les résultats des calculs seront accessibles aux scientifiques du monde entier.

En février 2020, l’équipe de Folding@Home a annoncé qu’une partie de ses efforts porteraient sur la recherche d’un traitement contre le SARS-CoV-2, le virus à l’origine de la Covid-19, et a lancé un appel aux internautes pour les inciter à contribuer depuis chez eux en installant le logiciel.

L’objectif est de comprendre le fonctionnement des protéines virales responsables de la maladie (lire ci-dessous « Comment fonctionnent les protéines responsables du SARS-CoV-2 ») en les modélisant en 3D.

Une mobilisation massive de milliers de particuliers et d’organisations a permis à Folding@Home de dépasser le seuil symbolique de l’exaFLOPS. Dans les mois qui ont suivi, les chercheurs ont mis à profit cette puissance de calcul : “Nous avons simulé la quasi-totalité du protéome du virus et découvert plus de 50 cibles nouvelles pouvant contribuer à la conception d’antiviraux”, a déclaré un chercheur de l’école de médecine de l’Université de Washington. “Nous avons également simulé des candidats médicaments dans des cibles connues, en passant au crible plus de 50.000 composés afin d’identifier 300 candidats médicaments.”

Comment fonctionnent les protéines responsables du SARS-CoV-2

Dans le cadre de la lutte contre la Covid-19, l’objectif de Folding@home est de comprendre le fonctionnement des protéines virales responsables de la maladie en les modélisant en 3D. La première étape de l’infection se produit dans les poumons, lorsqu’une protéine virale, appelée protéine Spike, s’attache à une protéine présente à la surface des cellules pulmonaires : le récepteur ACE2. Un anticorps thérapeutique est un type de protéine qui permettrait d’éviter ce processus, empêchant ainsi le virus d’infecter la cellule pulmonaire.

Source : https://foldingathome.org/2020/02/27/foldinghome-takes-up-the-fight-against-covid-19-2019-ncov/ 

A lire aussi sur Hello Future

Réseau mobile open source intégral avec mécanisme de hiérarchisation du trafic

Découvrir

2009-2019 : retour vers le futur du cloud computing

Découvrir

Couverture extrême en 5G

Découvrir

Thomas Morin, ingénieur réseaux en mode open source

Découvrir

Vers une plateforme ouverte et programmable : GlobalOS

Découvrir