Une coupure Internet ? un service indisponible ? un problème de Wi-Fi ? La résolution de ces problèmes mobilise de nombreuses équipes d’Orange, avec l’objectif d’offrir le meilleur service possible à ses clients. Cet engagement s’étend des équipes opérationnelles jusqu’aux équipes de recherche.
Le diagnostic est un enjeu majeur pour Orange puisqu’il permet de conserver un haut taux de satisfaction client, de maîtriser les coûts opérationnels et de limiter l’empreinte carbone liée aux déplacements et interventions sur le terrain.
Alors si, pour le client, Internet commence et s’arrête à la box, pour Orange, la réalité est toute autre, et anticiper la résolution de certaines pannes relève du défi.
Plongée dans un monde tentaculaire.
Qu’y a-t-il au bout de la fibre ?
Le réseau d’accès fixe représente les derniers mètres ou kilomètres de fibre pour transporter Internet jusqu’à la Box du client. Mais ce parcours n’est pas toujours un long fleuve tranquille. Box, point de terminaison, point de branchement, point de mutualisation, coupleurs, centraux… L’information parcourt un long chemin du client jusqu’au cœur du réseau. A cela s’ajoutent les services comme la TV, la VoIP ou la data. Bref, autant de sources possibles de pannes qu’il n’est pas aisé de diagnostiquer.
Une fois les données collectées, elles sont traitées par un système expert de diagnostic qui contient toute la connaissance des pannes déjà rencontrées.
Il faut également garder à l’esprit que le réseau est en constante évolution, que ce soit au travers de changements d’équipements réseau, de topologie ou de configuration, mais que les services et les usages, eux aussi, évoluent. La constante mutation de l’environnement explique notamment l’apparition de nouvelles pannes qu’il convient d’identifier, de caractériser et d’anticiper.
Allô docteur ?
Pour s’assurer du bon fonctionnement de la ligne d’un client, Orange est capable de prendre le pouls de son réseau. Un client se plaint d’un problème ? Un test sur la ligne du client permet de collecter des informations techniques sur l’état de sa connexion et de ses services. Autant d’informations précieuses pour déceler d’éventuelles anomalies.
Une fois les données collectées, elles sont traitées par un système expert de diagnostic qui contient toute la connaissance des pannes déjà rencontrées. Le but de ce système de diagnostic est d’analyser les données et de catégoriser la panne subie par le client. Lorsque le système identifie une panne connue, il est alors aisé de mettre en place le meilleur protocole pour résoudre cette panne : si une intervention est nécessaire, le technicien saura précisément où intervenir ou, parfois, les équipes opérationnelles savent qu’il n’y a besoin d’aucune intervention et qu’il suffit par exemple de programmer l’envoi d’un nouvel équipement au client, directement depuis l’appel au téléconseiller.
C’est donc du temps gagné, à la fois pour le client qui verra son service rétabli plus rapidement et pour les équipes d’Orange qui pourront se concentrer sur des interventions plus complexes.
La problématique des pannes inconnues
Toutefois, aucun système n’est infaillible et il subsiste des pannes qui ne peuvent pas être identifiées automatiquement à l’heure actuelle. Mais pas de panique ! Même dans ce genre de situation, les équipes d’Orange disposent de protocoles qui permettent toujours d’aboutir à une solution pour le client. Le caractère nouveau d’une anomalie implique cependant que le rétablissement des services du client sera plus délicat et plus long que lorsque l’on a affaire à une panne connue depuis longtemps.
La mise en évidence et la caractérisation des pannes inconnues devient donc un enjeu majeur afin d’intégrer au mieux les évolutions du réseau dans la chaîne de diagnostic.
Et la recherche en IA dans tout ça ?
Mettre en lumière de nouveaux types de pannes sur le réseau n’est pas chose facile. Il est nécessaire d’analyser et de croiser des milliers de données techniques et à l’heure actuelle aucune solution n’existe : autant de grain à moudre pour les équipes de recherche.
Le but du jeu est d’identifier de nouvelles signatures de pannes dans les données clients pour lesquelles aucune conclusion connue n’est observée. Cette signature de panne se traduit concrètement par la recherche d’une association de paramètres techniques caractéristiques. Cela peut être par exemple l’apparition d’une alarme qui serait associée à la fois à la version d’un équipement et à un service donné. Bref, cela peut ressembler parfois à la recherche d’une aiguille dans une botte de foin de données.
Les travaux de recherche conduisent à élaborer des modèles de machine learning* (apprentissage machine) capables d’assister la découverte de nouvelles pannes. Ces modèles se construisent en s’appuyant sur de grandes quantités de données techniques issues du réseau.
Ici, contrairement à des approches classiques, l’idée est d’utiliser la connaissance sur les pannes déjà connues pour guider l’exploration de nouvelles pannes.
C’est ce type d’approches que nous avons développées sous forme de preuve de concept [Démo Salon de la recherche : https://mastermedia.orange-business.com/publicMedia?t=pmJe7ar1yN] et qui ont fait l’objet de publications scientifiques, à la conférence IEEE ICKG 2022 et dans la revue IEEE Access.
Le modèle de machine learning appris nous permet alors d’identifier plus facilement des clusters* de cas de pannes. Chacun de ces clusters peut généralement être caractérisé par une signature technique particulière.
Une amélioration en continu
Lorsqu’une nouvelle signature technique a été identifiée, elle est confiée aux experts réseau pour vérifier la validité de cette ébauche de nouveau diagnostic. Car, même dans un monde où la Data est omniprésente, l’expertise humaine reste au cœur du processus de validation. Pour cela, de nombreux tests sont réalisés. Ces tests sont d’autant plus importants que toute la chaîne du diagnostic peut être affectée par la validation d’une nouvelle signature technique de panne : téléconseillers, opérationnels, techniciens d’intervention etc.
Ce procédé peut alors être répété de manière régulière afin d’améliorer la chaîne de diagnostic de manière continue (voir figure), et la rendre plus robuste à tout type de changement sur le réseau. Il permet ainsi de conserver un haut taux de satisfaction client, de maîtriser les coûts opérationnels et de diminuer de plusieurs milliers de tonnes de CO2 par an l’empreinte carbone liée aux déplacements et interventions sur le terrain.