TALN

Traducteurs automatiques, correcteurs d’orthographe, moteurs de recherche, interfaces vocales ou assistants virtuels… Le traitement automatique du langage naturel (TALN) est partout, et nous l’utilisons quotidiennement. À l’intersection de la linguistique, de l’informatique et des mathématiques, cette discipline de l’intelligence artificielle vise à développer des outils informatiques capables de comprendre et parler notre langue afin de rendre l’usage des technologies plus simple et agréable et de nous fournir une multitude de services.

Pour ce faire, différents niveaux de traitement sont nécessaires : lexical, syntaxique, sémantique, pragmatique… La machine doit identifier les différents mots, leurs propriétés telles que leur rôle grammatical ou leur signification, et les relations qu’ils entretiennent, mais aussi saisir le sens de la phrase et le contexte particulier dans lequel elle a été formulée.

C’est très compliqué, parce que le langage naturel est caractérisé :

1) par son ambiguïté, qui se manifeste par le fait qu’un mot peut avoir plusieurs sens et par la multitude d’interprétations que l’on peut donner à une phrase ;
2) inversement, par sa variabilité, un même concept peut être désigné par plusieurs synonymes et une même idée par différentes paraphrases ;
3) par une certaine quantité d’implicite, c’est-à-dire ce qui n’est pas formulé expressément.

Les humains disposent d’une connaissance « d’arrière-plan » qui leur permet la plupart du temps de lever les ambiguïtés et de comprendre l’implicite. Ce qui n’est pas le cas de la machine. Ainsi, la « désambiguïsation lexicale » est un problème majeur dans le traitement des langues naturelles, dont la résolution permettrait des avancées importantes !

Même si de nombreux progrès restent à accomplir dans le domaine du TALN, des avancées spectaculaires ont été obtenues grâce à l’utilisation de techniques d’apprentissage automatique, notamment à base de réseaux de neurones artificiels, qui mobilisent aujourd’hui les efforts de nombreuses équipes de recherche.

A lire aussi sur Hello Future

Cybersécurité : attaques et détournements des IA

Découvrir
PLEAIS

P-C. Langlais (Pleais) : « Nos modèles de langue sont entraînés sur des corpus ouverts »

Découvrir
GettyImages - WineSensed vin et IA - wine and AI

WineSensed : utiliser l’intelligence artificielle pour prédire les préférences gustatives

Découvrir
Parlons Tech, le podcast d'Hello Future, le site de la Recherche et de l'Innovation d'Orange

Parlons Tech 9 : comment l’IA bouleverse-t-elle la conception des jeux vidéo ?

Découvrir
GettyImages - video game art concept

Jeux vidéo : comment l’IA générative facilite le travail des artistes-designers

Découvrir