L’analyse des sentiments sur le Web, outil prédictif prometteur

Un analyste regarde des données
L’analyse des sentiments permet de déterminer si une phrase ou un document entier sur le Web exprime un sentiment positif, négatif ou neutre sur un sujet donné. Outil éprouvé dans la vente et le marketing, cette méthode propose de tenter de prédire certains comportements ou événements en finance, en politique et dans le cinéma.

“Des chercheurs ont démontré que les prévisions de recettes des films au box-office basées sur l’analyse de sentiments sur Twitter étaient plus précises que celles basées sur les études de marché.”

Avis déposés sur les boutiques en ligne, posts sur les réseaux sociaux, critiques rédigées sur des sites spécialisés, articles de blog, messages de forum, réponses à des formulaires… Le Web contient aujourd’hui une énorme quantité de données textuelles, qu’il est possible d’analyser pour découvrir les opinions et les sentiments des internautes.

C’est l’objectif de l’analyse de sentiments, un sous-domaine du “text mining” (fouille de texte) qui consiste à extraire des informations subjectives à partir de sources textuelles grâce au traitement automatique du langage naturel.

Des chercheurs ont démontré que les prévisions de recettes des films au box-office basées sur l’analyse de sentiments sur Twitter étaient plus précises que celles basées sur les études de marché.

L’analyse des sentiments regroupe un ensemble de techniques qui déterminent la polarité (sentiment positif, négatif ou neutre) qu’exprime une phrase ou un document entier. Certains outils situent le message sur un spectre décrivant différents degrés de positivité ou de négativité, détectent des émotions (la joie, la tristesse, la colère, l’espoir, l’inquiétude, etc.) ou identifient des intentions (par exemple : intéressé, pas intéressé).

Ces techniques utilisent des lexiques de sentiments – des dictionnaires de mots étiquetés selon qu’ils correspondent à des sentiments positifs ou négatifs –, différentes méthodes d’apprentissage automatique ou une combinaison des deux.

Prédire le succès d’un film

L’analyse des sentiments peut être utilisée pour prédire le succès et les recettes d’un film au cinéma à partir de données recueillies sur les médias sociaux. Il est en effet possible de mesurer le buzz généré autour du film ou d’explorer les opinions et les attentes du public exprimées dans les commentaires publiés sous les bandes-annonces sur YouTube, accompagnés de hashtags sur Twitter ou de likes et d’émojis sur Facebook, dans les critiques sur AlloCiné, IMDb ou Rotten Tomatoes, ou dans les posts de blogs. Plusieurs équipes de chercheurs ont tenté de démontrer que les prévisions de recettes des films au box-office basées sur l’analyse de sentiments à partir de ces sources, en particulier Twitter, étaient plus précises que celles basées sur les études de marché.

Au Royaume-Uni, des chercheurs de l’école d’informatique du National College of Ireland ont mené un projet visant à prédire et classer le succès d’une quinzaine de films au box-office (le film va-t-il être un “flop”, rencontrer un succès moyen, devenir un “hit” ou un “superhit” ?) grâce à l’extraction de sentiments et d’émotions dans près de 85 000 tweets, combinée à des algorithmes d’apprentissage automatique. Ils ont utilisé le package Syuzhet, qui décompose chaque tweet en tweet positif ou négatif et leur attribue un score de sentiments. Quatre modèles d’apprentissage automatique différents ont été testés pour analyser les données, dont deux ont atteint un taux de précision supérieur à 60 %, résultat meilleur que les modèles utilisés dans d’autres études.

Anticiper les cours de la bourse

Les investisseurs et les traders cherchent depuis toujours à anticiper l’évolution des marchés financiers en s’appuyant sur différents types d’analyses financières. L’intelligence artificielle et l’apprentissage automatique leur ont fourni de nouveaux outils : des modèles prédictifs, construits à partir d’immenses quantités de données financières. La finance s’empare aujourd’hui de l’analyse des sentiments pour compléter son arsenal.

La finance comportementale a montré que les émotions peuvent influencer les décisions d’investissement en bourse, et donc affecter les cours financiers. Capter les émotions collectives – et en particulier celles des investisseurs – pourrait donc permettre de prédire les mouvements du marché boursier.

En 2011, des chercheurs analysaient déjà la corrélation entre les émotions exprimées sur Twitter et les indices boursiers (Dow Jones, NASDAQ, S&P 500). Leurs travaux préliminaires concluaient que lorsque les émotions (espoir, peur, inquiétude) véhiculées sur la plateforme de microblogging sont fortes un jour donné, le Dow Jones baisse le lendemain. “[…] Le simple fait de vérifier sur Twitter les explosions émotionnelles permet de prédire comment le marché boursier se comportera le jour suivant.”

Des chercheurs indiens ont, quant à eux, voulu démontrer l’intérêt de la prise en compte des sentiments et opinions exprimés sur les entreprises sur les réseaux sociaux et les sites d’actualité économique pour affiner la prédiction des cours de leurs actions.

L’analyse de sentiments peut exploiter d’autres sources de données, telles que les données biométriques (voix, expressions faciales) et même les données musicales. Une équipe de chercheurs internationale a proposé de sonder l’état d’esprit des investisseurs en s’appuyant non pas sur des données textuelles issues de commentaires postés sur les réseaux sociaux, mais sur les données de la plateforme de streaming musical Spotify.

Leur étude, publiée dans le “Journal of Financial Economics”, montre qu’il est possible d’utiliser les choix musicaux des utilisateurs de Spotify pour mesurer l’humeur moyenne des individus d’un pays, et la relier aux mouvements boursiers pour prédire le cours de l’indice national.

Sonder l’opinion publique

On connaît l’importance des réseaux sociaux dans la vie politique. Les internautes y partagent leurs points de vue, échangent sur l’actualité, interagissent avec des élus et des hommes politiques… Cela en fait un terrain d’étude pour des analystes qui souhaiteraient sonder l’opinion publique sur un sujet spécifique, un parti ou un homme politique, lors de l’élaboration d’un projet de loi ou avant une élection.

Pendant une campagne électorale, l’analyse de sentiments peut par exemple permettre de découvrir si un candidat est populaire ou non dans une région, ou s’il est perçu comme crédible sur un thème donné. Plusieurs études ont même cherché à montrer qu’il était possible de prédire les résultats d’une élection en analysant uniquement les données Twitter. Avec plus de 436 millions d’utilisateurs actifs mensuels début 2022, le réseau social est devenu particulièrement influent dans le domaine politique.

Un utilisateur de Medium a essayé de déterminer l’humeur politique de chaque État des États-Unis quelques semaines avant l’élection présidentielle américaine de 2020 à partir de données Twitter. Il a recueilli des tweets émis au cours de la semaine précédant l’élection en utilisant une API Twitter, et a effectué une analyse des sentiments à l’aide de VADER (Valence Aware Dictionary and sEntiment Reasoner). Cet outil open source qui s’appuie sur un lexique de sentiments est spécifiquement adapté aux sentiments exprimés sur les médias sociaux. Il permet de déterminer à la fois leur polarité et leur intensité.

L’auteur a catégorisé les États états-uniens : fortement républicain, fortement démocrate, plutôt républicain, plutôt démocrate et État dans lequel les données sont insuffisantes. D’après les résultats de son analyse, 21 États ont été comptés comme républicains et 16 comme démocrates en fonction des sentiments exprimés sur Twitter. L’opinion de 13 États est restée indéterminée en raison de données insuffisantes. Si plusieurs de ces prédictions se sont révélées fausses, l’expérience est toutefois susceptible d’en précéder d’autres, la conversation, y compris politique, prenant de plus en plus de place dans le champ des réseaux sociaux. Permettant de sonder les opinions et les attentes, les craintes et les espoirs des internautes, l’analyse de sentiments est aujourd’hui un domaine en plein développement en raison des progrès réalisés en traitement automatique du langage naturel et des nombreuses applications qu’elle ouvre.

A lire aussi sur Hello Future

Pranavesh Panakkal et Dr. Jamie Ellen Padgett expliquant le fonctionnement de leur modèle OpenSafe Fusion.

Inondations : comment le machine learning peut aider à sauver des vies

Découvrir
Trois personnes collaborent autour d'un ordinateur portable dans un environnement de bureau moderne. L'une d'elles, debout, explique quelque chose aux deux autres assis, qui semblent attentifs. Sur la table, on peut voir un ordinateur de bureau, une tablette et des accessoires de bureau. Des plantes et des bureaux sont visibles en arrière-plan.

FairDeDup : un outil pour aider les modèles d’IA à se libérer des biais sociaux

Découvrir
Parlons Tech, le podcast d'Hello Future, le site de la Recherche et de l'Innovation d'Orange

Parlons Tech 14 : comment l’IA aide-t-elle à apprendre ?

Découvrir
GettyImages - interview David Caswell

David Caswell : « Tous les journalistes doivent être formés à l’IA générative »

Découvrir
Parlons Tech, le podcast d'Hello Future, le site de la Recherche et de l'Innovation d'Orange

Parlons Tech 13 : la médecine du futur dopée par l’IA

Découvrir
GettyImages - diagnostic generative AI

Santé : l’IA de Jaide entend réduire les erreurs de diagnostic

Découvrir
GettyImages - gig workers, gig economy

Des chercheurs veulent aider les travailleurs des plateformes (Uber, etc.) à s’organiser avec l’IA

Découvrir