Une expérience enrichie avec le système Conversational search for general knowledge pour les utilisateurs qui posent des questions d’ordre général à leur majordome virtuel au sein de la maison.
Les ventes d’assistants domestiques progressent et nous sommes nombreux à les utiliser au quotidien, majoritairement pour répondre à trois demandes : connaître la météo, lancer le morceau de musique choisi et poser des questions d’ordre général. C’est sur cette dernière utilisation que s’est penchée l’équipe de chercheurs.
Améliorer les usages de l’Intelligence Artificielle
« Nous nous sommes rapidement rendu compte de certaines limites des assistants vocaux lorsqu’ils sont interrogés sur des questions d’ordre général. Ils ne sont généralement capables de répondre que lorsqu’ils disposent dans leur base de connaissances de la réponse en l’état à la question posée et si possible sous une formulation similaire, l’interaction avec eux est rarement un vrai dialogue, et, ils ne fournissent qu’une seule réponse, difficile à vérifier. Nous avons donc essayé de bâtir un système qui améliore ces points, expose Frédéric Herledan, Chef de projet de Recherche chez Orange. Nous avons travaillé sur une multitude de sujets, d’un point de vue scientifique et technique, tels que la reconnaissance de la parole et du locuteur, le raisonnement logique sur des connaissances structurées ou encore le dialogue avec la machine. »
Un système qui fournit des réponses intelligentes et sensibles
Conversational search for general knowledge montre un système qui répond aux questions factuelles d’ordre général en aidant l’utilisateur à mieux juger la pertinence des réponses. « Pour cela, il élabore plusieurs solutions alternatives d’après la source Wikidata, au besoin en combinant différents fragments d’information disponibles au sein de cette source, présente d’abord la plus probable et autorise l’accès aux autres réponses possibles. Il peut expliquer comment il a procédé pour bâtir certaines réponses, et présenter des extraits de textes issus de Wikipédia ou des fiches d’information issues de Wikidata pour élargir le point de vue sur la question, poursuit Frédéric Herledan. Nous nous sommes également penchés sur la personnalisation de l’interaction et le dialogue avec la machine. Notre système est capable de reconnaître son locuteur et de s’adresser à lui personnellement. Par ailleurs, il sait faire le lien entre deux questions posées l’une à la suite de l’autre, sans pour autant que tous les mots clés soient répétés. On peut par exemple lui demander « Quel âge a Barack Obama », puis « Quel âge a sa femme ? » Il sous-entend alors qu’on parle de la femme de Barack Obama. Le dialogue avec le système devient fluide ! »
Un système 100 % made in Orange
Le système Conversational search for general knowledge exploite une multitude d’API (application program interface) développées au sein d’Orange. Du système d’identification, de la reconnaissance vocale, à la réponse fluide fournie par la génération, le système chemine d’API en API pour faire une analyse sémantique de la question et y répondre en raisonnant sur les données de la base de connaissances. La restitution vocale est ensuite générée par un système de synthèse de la parole, issu d’un essaimage d’Orange. Ce système tout entier pourrait tenir dans un ordinateur de maison un peu puissant afin de répondre au besoin des utilisateurs réfractaires à la transmission de leurs données sur Internet, tel que c’est le cas pour les assistants virtuels existants.