● Pour éviter un déséquilibre trop important qui renforcerait la fracture numérique entre les pays développés et les pays émergents, il est impératif d’investir massivement dans l’éducation au numérique à différents niveaux.
● Des chercheurs travaillent actuellement à développer des agents conversationnels vocaux plus inclusifs et adaptatifs, capables de comprendre près de 2.000 langues, contre 200 actuellement.
L’explosion tant attendue des usages liés à l’IA est sur le point de renforcer la fracture numérique dans le monde : sur plus de 7.000 langues parlées dans le monde, seules quelques centaines bénéficieront des outils de reconnaissance vocale et, plus largement, de l’ensemble des technologies d’intelligence artificielle. Pour fonctionner correctement, ces services nécessitent d’être nourris de données locales de qualité. Encore faut-il que ces dernières existent en quantité suffisante et qu’elles soient correctement annotées. Les deux conditions ne sont pas remplies pour les pays émergents qui souffrent déjà d’un manque d’accès à la connectivité, pourtant essentiel à leur croissance économique. La Banque mondiale estime qu’un taux de pénétration d’Internet de 75% dans les pays en développement pourrait créer 140 millions d’emplois.
Le risque est de voir le fossé se creuser en matière d’usages entre les pays développés et les autres : les produits IA qui sortent comportent des biais et sont majoritairement conçus dans les pays du Nord. « Il existe un problème de partialité dans les produits d’IA », alerte Jane Munga, experte des politiques technologiques en Afrique à la Fondation Carnegie pour la paix internationale. « Le développement de l’IA nécessite des infrastructures et des compétences spécifiques. La plupart des écosystèmes ne sont pas en mesure d’être compétitifs dans ce domaine, car ils ne sont pas développés », précise-t-elle. En Afrique, d’après la spécialiste, des politiques publiques transparentes doivent également assurer la fluidité des marchés : « Nous devons nous assurer que les marchés restent ouverts, que les fonds ou les données peuvent être transférés d’un pays à l’autre sans difficulté. »
Investir dans l’éducation numérique
En termes de formation, la route est encore longue : « Les individus doivent savoir quelles technologies sont à leur disposition et comment les utiliser. Et cela doit être abordé dès le plus jeune âge dans le cadre du programme scolaire. Ensuite, on parle des compétences qui nécessitent d’utiliser la technologie pour améliorer sa vie, par exemple pour créer une entreprise. Enfin, nous devons encourager les compétences de haut niveau, les développeurs, par exemple, pour tirer parti de technologies telles que l’IA », poursuit-elle. Car le développement de l’IA nécessite des infrastructures, de la disponibilité et accessibilité des données et des compétences spécifiques. Dans son rapport « Bridging the Gap », la Digital Cooperation Organization indique que, si les universités peinent à suivre les avancées technologiques, les pays émergents font eux face à la fuite des talents les plus qualifiés. Pour Jane Munga, les pays émergents sont aujourd’hui très innovants mais nécessitent davantage de soutien : « Nous devons renforcer l’écosystème innovant en soutenant les entrepreneurs et en finançant leurs innovations pour les internationaliser en Afrique. Un entrepreneur ghanéen doit avoir la capacité de développer ses services dans d’autres pays. » Il n’en reste pas moins que, selon la Digital Cooperation Organization, 47% des entreprises dans ces pays estiment que le manque de formation des employés constitue un frein quant à leur engagement dans le monde numérique.
L’enjeu est de proposer des modèles d’apprentissage automatique suffisamment précis pour préserver les langues et leurs histoires
Des solutions technologiques plus inclusives
Comment donc rendre accessible au plus grand nombre des outils IA qui, par leur conception, ne le sont pas ? Des initiatives commencent à fleurir : à l’université de Carnegie Mellon, une équipe de chercheurs pense être capable de rendre les outils de reconnaissance vocale accessibles à 2.000 langues contre 200 actuellement, soit près d’un quart des langues parlées dans le monde. C’est un défi de taille, car la majorité des outils de reconnaissance vocale nécessitent des machines de calcul puissantes capables de traiter des ensembles de données textuelles et audio pour fonctionner et, si les données textuelles sont plus faciles à trouver, les échantillons audio transcrits le sont moins.
En matière d’IA, les technologies de reconnaissance vocale se concentrent généralement sur les phonèmes – les sons articulés – d’une langue. Les chercheurs ont cependant décidé d’aborder une autre méthode, à savoir la manière dont les phonèmes sont partagés entre différents langages. En cartographiant les liens de parenté et les relations entre toutes les langues, ils ont pu établir des règles de prononciation et ainsi entraîner un modèle de langage à parler des milliers de langues et ce, sans données audio.
La reconnaissance vocale des langues africaines, dans un contexte de présence de l’illettrisme, peut aider à combler le fossé numérique et linguistique. Ces recherches prometteuses en matière d’inclusion numérique n’en sont qu’à leurs débuts. L’enjeu pour l’équipe de recherche est de proposer des modèles d’apprentissage automatique suffisamment précis pour préserver les langues et leurs histoires, tout en leur offrant l’opportunité d’être intégrées dans des outils modernes.
Sources :
ASR2K: Speech Recognition for Around 2000 Languages without Audio (anglais)
En savoir plus :
To Close Africa’s Digital Divide, Policy Must Address the Usage Gap (anglais)
Un bot vocal en langue subsaharienne