L’IA, boîte à outils anti-Covid

La Covid-19 a accéléré l’usage des technologies d’intelligence artificielle dans le domaine de la santé. Plusieurs d’entre elles ont permis des avancées significatives en matière de lutte contre la pandémie.

“Le graal étant d’aider les chercheurs et praticiens à découvrir des connaissances latentes.”

Sollicitée pour répondre à la crise sanitaire de la Covid-19, l’intelligence artificielle (IA) s’est montrée efficace dans plusieurs aspects de la lutte contre la pandémie, qu’il s’agisse de comprendre ce nouveau coronavirus, de le diagnostiquer, d’en prévoir l’évolution, de ralentir sa propagation ou d’accélérer d’autres aspects de la recherche médicale.

Plus d’un an après le début de la crise, les outils basés sur l’IA continuent de se multiplier et de donner de bons résultats. La nécessité d’accélérer leur déploiement ne doit toutefois pas faire oublier les questions éthiques qu’ils soulèvent.

Le machine learning pour améliorer la prise en charge

Lorsqu’un patient se présente à l’hôpital, il est important de savoir s’il est atteint de la Covid-19 et de déterminer s’il risque de développer une forme grave de la maladie, afin de lui fournir les soins appropriés et d’optimiser l’utilisation des ressources médicales limitées.

Dès le début de la pandémie, plusieurs outils ont été proposés pour faciliter le diagnostic. Une équipe de chercheurs de l’université d’Oxford, au Royaume-Uni, a par exemple développé deux modèles d’apprentissage machine, entraînés à partir des données de routine issues du dossier médical de plus de 100 000 patients, permettant un dépistage quasi instantané chez les patients se rendant aux urgences.

Aux États-Unis, des chercheurs du MIT de Boston travaillent quant à eux sur un modèle capable de détecter les cas asymptomatiques grâce à l’analyse d’une toux enregistrée sur un téléphone portable.

D’autres outils se concentrent sur le pronostic dans le but d’améliorer la prise en charge des patients, en particulier des cas graves et critiques. En France, AI-Severity établit un score de gravité permettant de classer les patients atteints de la Covid-19 en fonction de sa probable évolution.

Fruit d’un partenariat entre un consortium de recherche dirigé par Nathalie Lassau, de l’Institut Gustave Roussy, et la start-up Owkin, l’indice est établi à partir de l’analyse croisée de cinq variables cliniques et biologiques, de facteurs de comorbidité, et de l’utilisation d’un modèle de deep learning entraîné à prédire la sévérité de la maladie à partir d’images de scanner thoracique.

Développé en un temps record, AI-Severity a été déployé dans le service de radiologie de l’Institut Gustave Roussy. Il a fait l’objet d’une publication dans la revue scientifique “Nature” et son code est accessible aux chercheurs et hôpitaux du monde entier.

La data pour éclairer l’action publique

L’IA et l’analyse de données se sont révélées très utiles pour caractériser le virus SARS-CoV-2, modéliser sa transmission et apporter un appui aux efforts déployés en matière de santé publique.

L’algorithme développé par BlueDot, au Canada, est un exemple représentatif de cette contribution. Capable de détecter les risques de propagation de maladies infectieuses en analysant de nombreuses sources (articles de presse, données démographiques, données climatiques, etc.), il a permis à la start-up nord-américaine de déceler des cas de pneumonie inhabituels dans la ville chinoise de Wuhan, et d’alerter ses clients (gouvernements, services de santé et entreprises) plusieurs jours avant que l’OMS ne formule ses premiers avertissements sur l’apparition d’un nouveau coronavirus.

Par la suite, grâce à l’analyse des ventes de billets d’avion, BlueDot a pu identifier la majorité des premières villes touchées.

Pour guider la recherche et l’action publique, les données téléphoniques elles aussi peuvent être utilisées, car elles permettent d’établir des statistiques précises et actualisées sur les déplacements de la population.

Ces statistiques peuvent servir de base aux chercheurs pour développer des modèles destinés à prédire l’évolution d’une épidémie ou comprendre l’impact de mesures sanitaires. Elles intéressent aussi les autorités : si celles-ci connaissent le pourcentage de la population ayant quitté les grandes villes avant le confinement et où elle s’est ensuite répartie sur le territoire, elles peuvent mieux planifier les moyens hospitaliers.

C’est dans cette perspective qu’Orange a collaboré avec une équipe de recherche de l’Inserm, lui fournissant des statistiques issues des données techniques de son réseau mobile en France, dans le respect absolu de la vie privée de ses clients et utilisateurs. Il ne s’agissait pas de s’intéresser aux déplacements au niveau individuel, mais d’analyser des données quantitatives anonymisées rendant compte de la mobilité avant et après le confinement sur le territoire français et, plus tard, permettant de mieux prévoir la propagation du virus.

Le TAL pour “digérer” l’information scientifique

Face à la Covid-19, les chercheurs du monde entier se sont rapidement et massivement mobilisés, ce qui a donné lieu à une avalanche de publications scientifiques. La base de données ouverte LitCovid recense aujourd’hui plus de 100 000 articles. À cela s’ajoute la profusion de données issues des essais cliniques : à ce jour, plus de 4 900 études enregistrées dans 135 pays sur le site clinicaltrials.gov.

Mais si la littérature sur la Covid-19 est abondante et librement accessible, elle est devenue indigeste, car il est extrêmement difficile de s’y retrouver ! Cela a suscité plusieurs initiatives, permettant de catégoriser et évaluer les articles, ou de créer des visualisations interactives.

L’enjeu est d’orienter chercheurs et praticiens vers les résultats de recherche les plus pertinents pour eux et de faciliter leur interprétation, le graal étant de les aider à découvrir des “connaissances latentes”, dans le domaine du repositionnement de médicaments par exemple (qui consiste à tester un médicament déjà mis sur le marché ou approuvé pour une maladie pour en traiter une autre).

Des spécialistes en traitement automatique du langage naturel (TAL) sont alors venus en renfort pour pouvoir prendre en compte les sources de données non structurées. Ils ont mis en place des outils capables d’extraire des informations utiles d’une grande variété de publications scientifiques référencées dans différents sites, de les classer (spécialité(s) concernée(s), articles revus par les pairs ou non, niveau de preuve, etc.), voire de générer eux-mêmes des synthèses (principaux résultats, méthodes employées, etc.).

Le portail COVIDScholar, par exemple, utilise le TAL pour permettre aux utilisateurs d’effectuer une recherche sur des milliers d’articles, de brevets et d’essais cliniques. De son côté, Benoit Favre, chercheur au Laboratoire d’Informatique et Systèmes (LIS), a lancé un projet pour faciliter la veille bibliographique sur la Covid-19 à l’aide du TAL. Il travaille notamment sur un outil de catégorisation automatique en soutien à la plateforme Bibliovid, dont les contributeurs résument et classent manuellement les articles médicaux.

Les défis de l’IA au temps du coronavirus

L’urgence dans laquelle nous nous trouvons ne doit toutefois pas reléguer au second plan les questions éthiques et les exigences de robustesse des systèmes d’IA déployés. Ceux qui développent ces systèmes et ceux qui autorisent leur utilisation doivent veiller à leur conformité à certains principes : respect des droits humains et de la vie privée, sécurité, transparence, équité.

Or, comme le souligne cet éditorial de “The Lancet Digital Health”, une certaine indulgence vis-à-vis des “algorithmes Covid-19” a soulevé des inquiétudes parmi des chercheurs, qui rapportent que des modèles d’IA sont mal documentés et entraînés sur des ensembles de données de petite taille ou de faible qualité avec un risque élevé de biais. Le danger ultime serait que l’usage prématuré de technologies d’IA augmente les erreurs de diagnostic et compromette la qualité des soins.

De manière générale, “The Lancet” souligne l’importance de développer ces outils en étroite collaboration avec le personnel médical afin de mieux définir un cadre, de s’assurer de répondre aux bonnes questions et d’apporter une véritable valeur ajoutée.

L’IA seule n’est pas non plus une solution miracle. Par exemple, comme le rappelle le Conseil de l’Europe, “les difficultés structurelles rencontrées par les infrastructures sanitaires […] ne relèvent pas de solutions technologiques, mais de l’organisation des services de santé, qui devraient pouvoir prévenir de telles situations”.

A lire aussi sur Hello Future

Deux personnes sont assises devant un ordinateur, discutant d'un projet. Des bobines de fil sont visibles sur la table.

Ne pas reproduire préjugés et erreurs humaines dans les LLMs : comment faire ?

Découvrir

Allier IA et clustering pour un réseau mobile sans congestion

Découvrir
GettyImages - Noria knowledge graph - graphe de connaissances

NORIA : détection d’anomalies réseaux à l’aide des graphes de connaissances

Découvrir
GettyImages - FoodProX

FoodProX : détecter les aliments ultra-transformés grâce au machine learning

Découvrir
GettyImages - Brain Computer Interface BCI - ICO

L’enjeu d’une Interface Cerveau Ordinateur fonctionnant pour tout le monde

Découvrir
GettyImages - urbanisme

Les promesses de l’apprentissage automatique pour la rénovation urbaine

Découvrir
Getty Images - measure AI and carbon - mesure IA et carbone

Un outil pour limiter l’empreinte carbone de l’IA

Découvrir
GettyImages - machine learning research - recherche en apprentissage automatique

Prise de décisions précoces basée sur le Machine Learning (ML-EDM)

Découvrir