• L’outil s’adresse aux entreprises, journalistes et analystes financiers, pour les aider à vérifier les informations grâce à une analyse sémantique et le concours de moteurs de recherche.
• Basé sur des données de qualité, l’outil évite les biais génératifs, respecte la confidentialité et peut-être intégré à des outils de gestion de contenus (CMS) grâce à son API.
À quel besoin répond Factiverse ?
Vérifier des informations – le fact-cheking – est une tâche laborieuse, surtout quand on doit traiter des contenus multilingues ou des informations chiffrées. Les modèles de langue sont prometteurs, mais limités en termes de précision, notamment lorsqu’il s’agit d’évaluer la véracité des déclarations publiques. Par ailleurs, les modèles de langues posent des questions de confidentialité. Factiverse est un outil de fact-checking breveté qui identifie les phrases, ou affirmations de personnalités dans des articles et effectue des recherches à partir de sources crédibles en utilisant différentes techniques. Ces résultats sont ensuite évalués en agrégeant et résumant les preuves obtenues. À la différence des LLMs existants, nos modèles spécialisés offrent une performance plus importante dans le fact-checking.
Concrètement les textes ne sont pas analysés au niveau d’un mot ou d’une entité, mais à partir d’une phrase entière que nous appelons “revendication”
Quel est le fonctionnement technique de votre outil de fact-checking ?
Les modèles de langage XLM-RoBERTa-Large, lorsqu’ils sont fine-tunés, offrent une solution efficace et autohébergeable, abordant ainsi les préoccupations liées à la confidentialité. Notre technologie repose sur l’apprentissage profond et le traitement automatique du langage, et non sur des modèles génératifs, ce qui apporte moins d’erreurs et moins de biais de génération (hallucinations). C’est également possible car nous entraînons nos modèles sur des données de haute qualité, à la différence de ce que peut faire OpenAI. Concrètement les textes ne sont pas analysés au niveau d’un mot ou d’une entité, mais à partir d’une phrase entière que nous appelons « revendication » (claim, en anglais). Aujourd’hui nous sommes meilleurs que Mistral et GPT dans 140 langues et nous pouvons analyser toutes les phrases en les recherchant dans de multiples moteurs de recherche. Nous associations et comparons ensuite ces phrases avec des sources qui sont considérées comme crédibles, par exemple pour les sujets climatiques avec le Guardian qui est très bon dans ce domaine.
Comment s’est développée la start-up et comment la solution peut-elle être intégrée dans des outils professionnels ?
Le lancement de la start-up a été encouragé par un transfert de technologie de l’Université de Stavanger où Vinay Setty, professeur associé au département d’ingénierie électrique et d’informatique, a développé notre technologie brevetée. Entre 2021 et 2023, nous avons expérimenté et testé la solution dans le monde de la finance et des médias : notre solution technologique est avancée, mais il fallait l’adapter à la réalité du marché afin de répondre aux besoins réels des utilisateurs. Nous avons lancé l’outil de fact-checking à l’été 2023. Depuis nous avons enregistré 5000 inscriptions à la plateforme partout sur la planète. Notre modèle économique repose également dans la commercialisation de notre API, car les utilisateurs n’ont pas nécessairement envie d’apprendre à utiliser une nouvelle plateforme et préfèrent des solutions intégrées à leurs outils existants. Ils ont besoin de résultats fiables et ils peuvent ainsi utiliser Factiverse quand ils font de la recherche documentaire ou qu’ils écrivent. Cette solution peut donc être intégrée dans des systèmes de gestion de contenu (CMS).
Qui sont les utilisateurs finaux ?
Les médias peuvent s’en servir pour faire du fact-checking d’articles, de formats audios et vidéos. Les journalistes manquent souvent de temps pour examiner toutes les vidéos, comme celles des débats électoraux. La transcription automatique couplée à notre solution permet de vérifier efficacement les propos des personnalités politiques. En France par exemple, on a observé que de nombreuses personnalités politiques utilisent TikTok pour leur influence, d’où l’intérêt d’être en mesure de fact-checker à plus grande échelle. Aujourd’hui nous ne nous adressons pas exclusivement aux médias : dans le monde de la finance, les analystes ont également besoin de vérifier des informations avant de prendre des décisions.
Sources :
Surprising Efficacy of Fine-Tuned Transformers for Fact-Checking over Larger Language Models (en anglais)
En savoir plus :
Norwegian startup Factiverse wants to fight disinformation with AI (en anglais)