Prédire un problème, c’est pouvoir le résoudre avant que la qualité de service des réseaux Orange ne soit affectée. L’IA est une des clés pour y parvenir et le modèle présenté ici offre une solution performante et prête à être testée sur le terrain.
I. Qualité de service des réseaux mobiles : une connectivité qui progresse à l’aide de l’IA
Les réseaux mobiles sont de plus en plus complexes en raison de la demande croissante de trafic et de l’émergence de nouveaux services et technologies. La gestion de ces réseaux pose des défis considérables pour les opérateurs afin de garantir une bonne qualité de service (QoS) tout en réduisant les coûts opérationnels. L’automatisation de la gestion des réseaux mobiles est mise en œuvre à travers des fonctions de réseaux auto-organisés (SON – Self-Organized Network), elle permet d’optimiser les performances du réseau et de simplifier les tâches de gestion associées.
Ces dernières années, la puissance de l’intelligence artificielle est exploitée dans la gestion automatisée des réseaux mobiles, surtout dans le contexte de la maintenance prédictive.
La prédiction des anomalies offre aux applications mobiles ou aux opérateurs de réseaux mobiles la possibilité d’agir de manière proactive en évitant l’anomalie avant qu’elle ne survienne et d’établir leurs services d’une manière plus efficace.
Pour prédire les anomalies, en particulier les , dans les réseaux mobiles, un modèle d’apprentissage sur des données labélisées est adopté. Ce modèle de prédiction des congestions améliore la QoS. Cependant, certaines problématiques restent posées :
- Si l’apprentissage est effectué cellule par cellule, le nombre de modèles à entrainer est égal au nombre de cellules dans le réseau, induisant une complexité majeure d’implémentation.
- Si l’apprentissage est effectué sur l’ensemble des cellules, le modèle résultant n’est pas précis car les cellules ne se comportent pas toutes de la même manière, notamment entre zone rurale et zone urbaine.
Afin de résoudre ce dilemme, Orange propose de précéder la création du modèle d’apprentissage par une étape de regroupant les cellules ayant un comportement similaire dans des groupes ou clusters homogènes.
Orange adopte l’appellation de « modèle hybride » pour qualifier la combinaison du clustering des cellules et du modèle d’IA supervisé. Le modèle hybride permet de créer un modèle d’apprentissage spécifique à chaque groupe ou cluster de cellules.
Cette approche présente plusieurs avantages :
- Elle réduit la complexité en créant un nombre réduit de modèles d’apprentissage, ce qui est plus facilement gérable que d’avoir un modèle par cellule, et répond ainsi à la première problématique.
- Chaque modèle utilise un jeu de données riche car le nombre de cellules par cluster est assez important.
- Les modèles générés sont précis comme ils sont formés en se basant sur un ensemble de cellules homogènes, ce qui répond à la deuxième problématique.
Des expérimentations basées sur un jeu de données réel ont validé cette approche, montrant une meilleure prédiction des futures congestions dans le réseau. L’ajout de la technique de clustering améliore la précision des modèles et contribue à une meilleure anticipation des congestions.
Par ailleurs, un autre avantage de cette approche est la portabilité des modèles d’une ville à une autre. Les clusters sont également stables dans le temps. Cela se traduit par une facilité d’utilisation tout en économisant du temps et des ressources en évitant une mise à jour régulière des clusters.
II. IA et la prédiction des congestions dans les cellules mobiles
1. Principe
Une approche basée sur l’IA combinant deux techniques est adoptée pour grouper les cellules homogènes dans des clusters. Tout d’abord, la méthode LBM (Latent Block Model) [1] est appliquée sur un jeu de données contenant plusieurs indicateurs de performances des cellules (KPIs). LBM est une technique de clustering qui permet de regrouper à la fois les lignes et les colonnes d’un jeu de données. Les KPIs sont liés au volume de trafic, au nombre d’utilisateurs actifs, à la latence et à la charge des cellules. Ces KPIs sont sélectionnés pour détecter et analyser les congestions dans un réseau 4G. La congestion d’une cellule se traduit par le dépassement de certains seuils par les KPIs. Ensuite, le nombre optimal de clusters est obtenu en calculant la vraisemblance entre les clusters via le critère ICL (Integrated Complete Likelihood) [2].
2. Performances améliorées
Une première expérimentation a été réalisée pour prédire les congestions en se basant sur les données des cellules de Paris Nord Est. Le modèle de clustering a identifié une dizaine de groupes répartis en trois catégories : taux de congestion élevé, moyen et faible. Ensuite, un modèle d’apprentissage supervisé basé sur la régression logistique a été créé pour chaque groupe.
Pour la catégorie à taux de congestion élevé, qui représente 70% des congestions dans le jeu de données initial, les performances du modèle de prédiction ont été améliorées par rapport aux performances du modèle global créé avec l’ensemble des cellules. Pour un horizon de prédiction d’une heure, le modèle parvient à prédire 90,4% (rappel ou recall) des congestions avec une précision de 90,5%.
Pour les clusters moyennement congestionnés, le modèle de prédiction conserve les mêmes performances. Cependant, la précision des modèles a été augmentée en proposant un paramétrage adaptatif de la régression logistique.
En ce qui concerne la catégorie de cellules faiblement congestionnées, qui représente près de 20% des anomalies de congestion, les cellules appartenant à cette catégorie ont été éliminées de la prédiction des congestions. En effet, il est impossible de prédire la congestion pour ce type de cellules vu le nombre très faible d’occurrences de congestions. Sans la technique de clustering utilisée, il serait difficile de distinguer ces cellules qui génèrent de nombreuses fausses prédictions de congestion. Un modèle global sans la technique de clustering générerait plus de fausses alarmes que de bonnes prédictions, ce qui serait problématique puisque l’équipe opérationnelle ou le SON devraient corriger une congestion inexistante sur une cellule.
La précision de prédiction des congestions dans les réseaux mobiles est supérieure à 90% grâce à l’IA
III. Application du modèle hybride
La portabilité d’un modèle d’apprentissage offre plusieurs avantages, notamment la possibilité de réutiliser des modèles existants, ce qui permet d’économiser du temps et des ressources, tout en améliorant les performances. Cette section montre que le modèle hybride est portable d’une ville à une autre, ce qui signifie qu’il peut être utilisé dans différents contextes géographiques. De plus, ce modèle permet une prédiction précise des futures congestions, ce qui permet aux opérateurs de surveiller et de contrôler de manière proactive les anomalies avant qu’elles ne se produisent.
Le modèle a été appliqué pour les villes suivantes : Paris Nord Est, Strasbourg, Belfort et Lille. Dans la Figure 1, les différents clusters sont représentés par des couleurs distinctes. Cela montre que des cellules éloignées situées dans différentes villes se comportent de manière similaire vis-à-vis de l’anomalie. D’autre part, les techniques de géo-clustering qui regroupent les cellules proches géographiquement dans un même cluster, ne sont pas toujours précises. Un exemple illustré dans la Figure 2 montre que deux cellules proches, distantes de seulement 0,01 km, n’appartiennent pas au même groupe. Ce résultat est lié à l’orientation différente des cellules : la cellule bleue est orientée vers la forêt, tandis que la cellule rouge est orientée vers les bâtiments. En conséquence, la cellule bleue fait partie d’un groupe de cellules faiblement congestionnées, tandis que la cellule rouge fait partie d’un cluster de cellules fortement congestionnées. Ces observations remettent en question l’efficacité des approches basées uniquement sur la proximité géographique pour le regroupement des cellules et soulignent l’importance de prendre en compte d’autres facteurs, tels que le comportement des cellules qui se reflète dans les mesures des KPIs.
Pour illustrer la portabilité du modèle hybride, prenons l’exemple d’un cluster appelé A, qui comprend 83 cellules à Lille, quelques-unes à Belfort, 36 à Paris Nord Est et 65 à Strasbourg. Après examen des cellules du cluster A situées à Belfort, il est difficile de créer un modèle d’apprentissage précis en raison du faible nombre de cellules disponibles. Cela met en évidence l’importance de la portabilité du modèle, permettant de tirer parti des informations et des connaissances déjà acquises dans d’autres villes pour compenser le manque de données spécifiques à Belfort.
La création d’un modèle d’apprentissage est basée sur les données associées aux cellules du cluster A de la ville de Lille. Ensuite, ce modèle est utilisé pour prédire les congestions au niveau des cellules du cluster A situées à Strasbourg. Les résultats sont remarquables, car le modèle d’apprentissage transféré de Lille parvient à prédire avec précision les futures congestions à Strasbourg. Pour un horizon de prédiction d’une heure, le modèle arrive à prédire 87% des futures congestions avec 90% de précision. Cela démontre l’efficacité de la portabilité du modèle hybride et sa capacité à généraliser les connaissances d’une ville à une autre.
En outre, la création de clusters est stable dans le temps, ce qui indique que le modèle hybride n’est pas complexe. L’approche de clustering parvient à former des groupes de cellules presque identiques pendant deux années consécutives, avec seulement de légères différences. Ces différences mineures sont principalement dues à des erreurs liées à la collecte des données. Cette stabilité renforce la fiabilité de notre approche et confirme la capacité du modèle à former des clusters cohérents.
IV. Conclusion
Un modèle hybride basé sur IA améliore la prédiction des congestions dans les réseaux cellulaires. Ce modèle combine une technique de regroupement (clustering) avec un algorithme d’apprentissage supervisé, ce qui permet de prédire les anomalies de manière plus précise afin de garantir une bonne QoS. Le modèle hybride est capable de distinguer les cellules qui réagissent de manière similaire en cas de congestion dans les réseaux. En adaptant ce modèle, les performances de prédiction sont améliorées tout en réduisant le nombre de modèles d’apprentissage nécessaires.
L’approche proposée est portable géographiquement, ce qui signifie que les modèles d’apprentissage peuvent être transférés d’une ville à une autre. Cela s’est avéré particulièrement utile dans des situations où les données sont limitées dans certaines villes, en compensant le manque de données spécifiques. De plus, cette approche ouvre une voie pour prédire avec précision les congestions futures dans des cellules situées dans différentes villes.
Comme perspective, Orange suggère d’expérimenter le modèle hybride dans un réseau Orange live. Cette expansion permettrait de tester ce modèle dans des contextes variés et de recueillir des données provenant de différentes villes.
Sources :
- C. Bouveyron, L. Bozzi, J. Jacques and F. Xavier Jollois, “The Functional Latent Block Model for the Co-Clustering of Electricity Consumption Curves”, Journal of the Royal Statistical Society: Series C Applied Statistics, Wiley, In press, vol. 67, no. 4,pp. 897–915, 2018.
- G. Govaert and M. Nadif, Co-Clustering: Models, Algorithms and Applications, Wiley-ISTE, 2013.
En savoir plus :
S. Kassan, I. Hadj–Kacem, S. B. Jemaa and S. Allio, “A Hybrid machine learning based model for congestion prediction in mobile networks”, 2022 IEEE 33rd Annual International Symposium on Personal, Indoor and Mobile Radio Communications (PIMRC), Kyoto, Japan, 2022, pp. 583-588, doi: 10.1109/PIMRC54779.2022.9977541.
S. Kassan, I. Hadj-Kacem, S. Ben Jemaa and S. Allio, “Robustness Analysis of Hybrid Machine Learning Model for Anomaly Forecasting in Radio Access Networks”, 2023 IEEE Symposium on Computers and Communications (ISCC), Gammarth, Tunisia, 2023, pp. 1104-1109, doi: 10.1109/ISCC58397.2023.10218038.
S. Kassan, I. Hadj-Kacem, S. B. Jemaa and S. Allio, “Portability of Hybrid machine learning based model for anomaly forecasting in mobile networks”, 2023 IEEE 98th Vehicular Technology Conference (VTC2023-Fall), Hong Kong, Hong Kong, 2023, pp. 1-7, doi: 10.1109/VTC2023-Fall60731.2023.10333706.
Une congestion d’une cellule réseau signifie que la cellule est à pleine capacité. Cela se traduit par des pics de trafic qui mènent à des pertes des données, une augmentation de latence, un ralentissement de réseau et une dégradation de la QoS.
Le clustering fait partie des techniques d’apprentissage non supervisé. Il est utilisé pour regrouper des données non-étiquetées selon leur similarité et leur différence. Pour ce cas d’usage, il est utilisé pour grouper des cellules réseaux en fonction de leur similarité selon des indicateurs de performances (KPIs).