• Le projet de la start-up Osmo, appuyé par Google, utilise la méthode d’apprentissage automatique des réseaux de neurones à graphes (GNN).
• Cette approche permet de créer un modèle prédictif associant la structure des molécules constituant une odeur à des descripteurs.
L’intelligence artificielle (IA) est capable de beaucoup de choses aujourd’hui : reconnaître des objets, des visages, des sons, des voix, des signaux tactiles. Mais le traitement numérique des odeurs en est encore à ses débuts. « Caméras et micros sont des accessoires bon marché et répandus, ce qui facilite la collecte des données pour le traitement de l’image et du son. Des données relatives à l’olfaction exigent soit des instruments compliqués et coûteux, soit un travail long et pénible d’entrainement de testeurs humains d’odorants » explique Alex Wiltschko, neuroscientifique et fondateur d’Osmo Labs. Née en janvier 2023, Osmo Labs est une émanation d’un projet de Google Brain (la division IA Google, devenue DeepMind) cherchant à appliquer la technique des réseaux de neurones aux odeurs.
Ils ont utilisé deux bases de données professionnelles pour obtenir 5000 structures moléculaires où chacune est associée à plusieurs termes descriptifs
Des données sous forme de nœuds et de liens
Début septembre 2023, ce projet a donné lieu à un article de recherche dans la revue Science.
Il se base sur la méthode dite des réseaux de neurones à graphes, particulièrement adaptée au travail sur l’olfaction, qui correspond à la perception de molécules dans l’air. Or, un graphe est la représentation d’une donnée sous forme de nœuds et de liens entre eux, comme une molécule. En matière de données chimiques, donc, les nœuds sont les atomes et les liens, les liaisons atomiques. « Les réseaux de neurones à graphes sont plutôt récents et suscitent beaucoup d’intérêt de la part des chercheurs, pas uniquement dans le domaine de l’olfaction, aussi en chimie et biochimie, explique Matej Hladis,
Une base de 5000 structures moléculaires
L’article d’Osmo est signée de chercheurs de la start-up et du Monell Chemical Senses Center, à Philadelphie, spécialisé dans le domaine du goût, des odeurs et de la sensibilité des muqueuses. Ils ont utilisé deux bases de données professionnelles pour obtenir 5000 structures moléculaires où chacune est associée à plusieurs termes descriptifs. De cet ensemble, 80% a servi à l’entrainement du modèle. Le reste a été dédié au test, l’idée étant que le modèle associe les bonnes molécules aux bons descripteurs. Ses performances ont ensuite été comparées à celles de participants humains.
« Nous avons formé une cohorte de sujets à décrire leurs perceptions d’odorants en utilisant la méthode Rate-All-That-Apply [une échelle de notes pour dire à quel point un terme s’applique à un produit] et un lexique de 55 mots, écrit l’équipe dans son article. Durant cette formation, chaque terme du lexique a été couplé à des références visuelles et olfactives. » Une phase de prétest a permis de sélectionner des personnes capables de faire globalement les bonnes associations, soit une quinzaine.
Parmi les 55 termes, on trouve par exemple « tropical », « animal », « acide », « épicé », « menthe », « vert », « sulfureux », « rôti », etc. Les 15 participants se sont vu soumettre 400 odorants à caractériser avec ces mots et dont l’intensité était notée de 1 à 5. Le modèle d’IA a lui-aussi été évalué sur les mêmes odorants, pour voir dans quelle proportion il parvenait à prédire les bons descripteurs pour une molécule donnée, sachant qu’il n’avait « vu » aucun de ces odorants lors de son apprentissage (au final, 323 ont été conservés).
Une piste pour repenser la classification des odorants
Or, le modèle fournit des prédictions qui sont plus proches de la moyenne des notations d’odorants données par les participants qu’aucun de ces participants pris individuellement. L’équipe a aussi comparé les prédictions du modèle avec les réponses du « paneliste médian », à savoir celui qui divise en deux le groupe de participants (une moitié est moins bonne que lui, l’autre moitié meilleure). Or, pour 53% des molécules, le modèle décrit mieux les odorants. Pour l’équipe, ces résultats prometteurs ouvrent des pistes en biochimie ou en neuroscience de l’olfaction, pour repenser la classification des odorants ou mieux comprendre comment le cerveau fonctionne pour les reconnaître.