Quels sont les apports de la donnée dans le sport de haut niveau ?
L’exploitation de données peut favoriser, en premier lieu, la détection de potentiels. Il ne s’agit pas ici d’écarter certains sportifs, mais au contraire de ne pas louper les futurs talents qui passeraient au travers des mailles des systèmes de détection actuels. L’analyse de données permet de recalibrer les performances en fonction de la maturité et du stade pubertaire, de l’historique de la pratique ou des courbes de progression.
L’analyse de la concurrence est un autre champ auquel les données peuvent apporter une plus-value. Comment les équipes concurrentes gagnent et perdent ?
L’analyse de données permet aussi de réaliser un monitoring de l’entraînement en fonction du volume, de l’intensité, de la densité, de la modalité de récupération, de la fatigue, du sommeil, de l’humeur ou du stress. L’objectif est, cette fois, d’optimiser et d’individualiser les programmes en fonction des capacités de récupération, mais aussi de travailler sur la prévention des blessures. Un “Athlete Management System” (AMS) peut ainsi mesurer ce que l’athlète a réellement encaissé lors de l’entraînement par rapport au plan théorique initial, puis réguler les séances suivantes en fonction de l’état de forme de ce dernier.
La data aide aussi à mieux cerner la concurrence…
En effet, l’analyse de la concurrence est un autre champ auquel les données peuvent apporter une plus-value. Comment les équipes concurrentes gagnent et perdent ? Quels “patterns” (modèles) de victoire peut-on identifier puis modéliser ? Bien entendu, d’autres éléments peuvent être mesurés, objectivés, modélisés et visualisés à partir de la captation ou de la génération de données, par exemple l’analyse du geste sportif ou la création et la modélisation de phénotypes digitaux.
Cette exploitation de la data rencontre-t-elle des limites ?
Le champ des possibles est vaste et les retours d’expérience sur lesquels capitaliser nombreux. Pour autant, il faut être conscient des limites de l’apport des données. Il existe des limites humaines (activité chronophage, biais cognitifs), technologiques (biais de mesure et de restitution), conceptuelles (erreurs de prédiction), réglementaires (RGPD), voire déontologiques.
Parmi les biais cognitifs, il y a notamment les biais d’interprétation. En fonction des mêmes résultats, un staff en tirera des enseignements différents d’un autre. En ce qui concerne la protection des données personnelles, les techniques d’anonymisation ont aussi leurs limites. Il est facile d’identifier qui se cache derrière tel record enregistré à telle date. Par exemple, si je vous dis 9 secondes et 58 centièmes, en 2009, de suite, vous allez associer l’athlète ayant réalisé cette performance.
Quels sont les clubs ou les fédérations pionniers dans le domaine ?
Les structures professionnelles privées telles que les ligues américaines (NBA, NFL, NHL, MLB) sont celles présentant le plus de maturité et d’antériorité sur le sujet et également les budgets les plus conséquents. Ces franchises dans le football américain, le basketball ou le hockey ont été pionnières.
Viennent ensuite le football anglo-saxon puis européen, et le rugby anglo-saxon et de l’hémisphère Sud. Pour les Jeux olympiques de Londres en 2012, le Royaume-Uni a créé, via son agence nationale d’organisation des Jeux, un système centralisé de captation et d’utilisation des données dédiée avec des staffs conséquents qu’ils pérennisent aujourd’hui.
Qu’en est-il de la maturité du sport français en la matière ?
Notre culture latine freine parfois l’exploitation des données. Pour autant, les fédérations françaises de rugby, de ski ou de natation n’ont rien à envier à leurs homologues à l’étranger, avec des structurations de données depuis des décennies. Elles se sont dotées de cellules de supports scientifiques employant des data scientists.
Au niveau national, le sujet connaît une accélération nette ces cinq dernières années. Créé en 2020, le Sport Data Hub doit donner un avantage concurrentiel aux athlètes français pour les Jeux olympiques de Paris 2024 et au-delà. Il s’agit également de diffuser une culture de la donnée et de favoriser l’émergence de communautés de partage et de pratiques.
En prévision des Jeux de Paris, un programme prioritaire de recherche ciblant la très haute performance a, par ailleurs, été mis en place avec un budget de 20 millions d’euros pour accompagner les athlètes de haut niveau.
Parmi les projets lauréats que conduit l’INSEP, on peut citer Detect, qui vise à objectiver les performances des athlètes français dans leurs contextes de concurrence et à estimer leurs probabilités de bien figurer aux prochains J.O. Avec PerfAnalytics, il s’agit de déterminer comment l’analyse vidéo peut cerner des identificateurs de performance, diagnostiquer l’efficacité des gestes individuels et modéliser une stratégie réussie de séquence d’actions en fonction du contexte (équipement, adversaires, arbitres…).
Paraperf vise, lui, à optimiser les performances des athlètes en fauteuil avec comme objectif de pouvoir mettre la recherche au service des athlètes paralympiques et leurs staffs pour maximiser les chances de podium aux Jeux de Paris. Enfin, le projet Empow’her consiste à étudier l’impact des règles et des cycles menstruels sur les performances des sportives.
