La quasi-totalité des populations du globe ne s’expriment que dans une poignée des sept mille langues recensées à travers le monde. Des causes multiples confrontent les autres langues à des risques de dévitalisation, voire d’extinction. D’ici la fin du siècle, la moitié des langues du monde pourraient ainsi disparaître et, avec elles, des pratiques, des coutumes et des usages qui constituent la diversité culturelle de la planète. L’Assemblée Générale des Nations Unies a mis en exergue la fenêtre de temps limitée pour sauvegarder ces langues en faisant de la période 2022-2032 la Décennie internationale des langues autochtones.
Un prolongement numérique pour les langues
Tahitienne d’origine, Heiura Itae-Tetaa est animée depuis longtemps par le désir de préserver sa langue maternelle. Elle crée en 2018 une école dédiée à l’apprentissage du tahitien, avant que le coup d’arrêt lié à la pandémie de Covid-19 ne mette en évidence un manque essentiel. « J’ai réalisé qu’il n’existait pas d’outil simple pour faire basculer, et vivre, une langue sur le numérique. La création d’E-Reo en 2022 est une réponse à ce vide technologique et poursuit un objectif central : proposer une plateforme accessible, en forme de boîte à outils, permettant à toute organisation légitime de produire des applications mobiles dans une langue autochtone, à des fins d’apprentissage, de transmission, de promotion, etc. » L’histoire de la start-up est en liée à la rencontre d’Heiura avec Sébastien Christian, scientifique franco-américain dont l’expérience et les compétences à la croisée de la linguistique, des neurosciences et de l’IA contribuent à l’émergence de la plateforme d’un point de vue technologique. Ensemble, ils s’entourent d’une équipe talentueuse en apprentissage des langues, en génie logiciel et dans les domaines UX/CX pour donner vie à l’offre E-Reo.
Une plateforme ergonomique et accessible, en forme de boîte à outils, pour produire des applications mobiles dans une langue autochtone en toute autonomie
Des applis mobiles clés en mains
En quoi consiste celle-ci ? « Il s’agit d’une usine de création d’applis mobiles avec un zoom sur les langues autochtones, résume Sébastien. Parmi une bibliothèque de modèles d’applications (5 à ce jour) disponibles, le client choisit celle qui correspond à son besoin avant de la designer et de la personnaliser de façon autonome, sans avoir à être linguiste ni écrire la moindre ligne de code. Les applications créées sont toutes gratuites, utilisables sans connexion et adossées à une charte de respect des utilisateurs – pas de tracking, pas de collecte des données, pas de géolocalisation. »
Derrière les solutions techniques proposées se cachent des algorithmes propriétaires sophistiqués. Un premier set se concentre sur l’organisation des données linguistiques (mots, phrases, expressions, contenus audio/image) apportées par les clients pour créer leurs applications. Pour cela, des algorithmes évaluent le contenu sémantique et grammatical de chaque entrée afin de proposer des labels pertinents pour la classification et l’utilisation des contenus. Par ailleurs, E-Reo a mis au point un module intelligent embarqué, fondé sur un affûté avec des a priori adaptés au comportement humain, dédié spécifiquement à la personnalisation du parcours d’apprentissage d’une langue. La mission de ce composant est d’optimiser la progression de l’utilisateur/apprenant en s’adaptant à ses caractéristiques cognitives, pour lui soumettre les bons éléments nouveaux ou passés à mémoriser ou remémoriser, au bon moment.
Disruption en vue
Au-delà de ces technologies, déjà implémentées au sein de sa plateforme, la start-up est impliquée dans des travaux de recherche avancés au titre d’un partenariat public-privé, aux côtés d’acteurs académiques et institutionnels tels que l’Université de Polynésie Française, l’Institut Max Planck en Allemagne ou encore le CNRS en France. La problématique explorée dans ce cadre a trait à la quantité de données nécessaire pour produire des systèmes de traduction ou d’analyse automatique de la langue. « Le volume des langues, parmi les 7000 du monde, suffisamment documentées pour parvenir à du traitement automatique, est marginal, souligne Sébastien. Google Translate par exemple ne supporte qu’une centaine de langues, tandis que Meta, avec le projet No Language Left Behind, approche les 200. Le travail que nous menons s’intéresse à une approche nouvelle vis-à-vis de la question du traitement automatisé des langues, à des fins de génération. Une première étape-clé consiste à arriver, à partir d’un corpus linguistique réduit, à produire du contenu didactique, grammatical en particulier. » Dans cette perspective, le projet vise à l’élaboration d’un modèle hybride, associant une approche fondée sur la donnée et un système de règles, pour aboutir à une solution de traitement grammatical automatisé robuste et explicatif.
E-Reo au chevet des langues, partout dans le monde
En une année de commercialisation, une quinzaine de langues dans le monde ont pu accéder à une réalité numérique et générer simplement des contenus pédagogiques attractifs via E-Reo, touchant 10.000 utilisateurs finaux. Depuis sa base polynésienne en plein cœur du Pacifique, entre Amériques et Asie, E-Reo a une ambition mondiale. Depuis 2023, la start-up bénéficie d’une accélération dans le cadre du programme Women Start d’Orange Fab. « Cette solution innovante, explique Fanny Medina, directrice Business Development Open Innovation chez Orange, retient l’attention pour sa capacité à préserver les aspects essentiels des cultures de nos clients, plus particulièrement sur le continent africain. » Celui-ci, note Heiura, héberge un tiers des langues du monde. « A travers ce partenariat, E-Reo peut capitaliser sur l’implantation mondiale d’Orange pour étendre la portée géographique de son offre. Le défi des langues autochtones – leur conservation et leur revitalisation – est immense : ces combats doivent exister, E-Reo est une arme afin de les pérenniser et de les faire exister dans nos vies. » En une année d’existence, la plateforme a été utilisée par des clients sur 15 langues différentes, avec 25 applications produites et 10.000 utilisateurs finaux.
Langue autochtone :
Plus de 4000 langues autochtones sont recensées à travers le monde, sur un total de 7 000 langues. Les langues autochtones sont une composante essentielle de l’identité des peuples autochtones et de la préservation de leurs cultures. Leur disparition est associée à un risque de perte de connaissances traditionnelles et d’appauvrissement de la diversité culturelle à l’échelle mondiale.
Modèle de représentation des connaissances, fondé sur une description graphique des variables aléatoires, employé notamment dans les moteurs de recherche et recommandation.