Ces enjeux sont d’autant plus critiques que l’infrastructure Radio Access Network (RAN, cœur d’accès réseau) représente 80 à 90 % de la consommation énergétique totale des réseaux pour un opérateur mobile. Si des efforts sont déjà mis en œuvre pour atténuer leur empreinte énergétique – par exemple chez Orange, n’exploiter qu’une bande de fréquence la nuit quand les trafics sont limités – d’autres pistes peuvent être explorées pour aller plus loin.
Logique de mutualisation
Par exemple, différents opérateurs pourraient coopérer pour mutualiser leurs ressources et ainsi contribuer à réduire de façon significative la charge énergétique des réseaux. Dans le cas de figure étudié par Orange et présenté au salon de la Recherche et de l’Innovation, chaque opérateur accueillerait alternativement le trafic des autres durant un tour de garde d’une nuit. Un seul RAN resterait en activité, plutôt que 2, 3, 4 ou X selon le nombre d’acteurs impliqués dans la coopération. Prometteuse sur le papier, l’hypothèse doit remplir certaines conditions en termes d’équité et d’incitation à contribuer avant de se concrétiser. La question se pose en termes simples : les opérateurs joueront-ils le jeu ? “Pour y répondre, nous avons codé les règles du jeu et lancé des parties de coopération, explique Xavier Marjou, Ingénieur de Recherche Réseaux chez Orange. En faisant jouer des IA selon différentes règles, il est possible d’établir que le système de coopération proposé peut être fiable, équitable et bénéfique à l’ensemble des parties.”
Des négociations simulées
Il s’agit ici de simuler des négociations entre opérateurs et d’essayer de parvenir à ce que chacun joue le jeu et assume son “quart” à tour de rôle. “Nous avons instancié des agents logiciels représentant les intérêts de chaque opérateur, et ceux-ci ont appris à négocier entre eux au fil des parties. L’apprentissage s’opère ici par renforcement : l’agent joue et émet une action vers un environnement qui, en retour, lui transmet le résultat de cette action avec une récompense associée, positive ou négative. En enchaînant plusieurs actions, l’agent trouve au bout du compte le mix d’actions qui lui est le plus favorable. Dans notre cas d’usage, l’agent/opérateur se propose pour un tour de garde et reçoit en contrepartie une récompense proportionnelle au nombre de kWh économisés. Au fur et à mesure, il réalise que certaines séquences de négociation sont plus opportunes que d’autres, y trouve profit et est donc encouragé à continuer à jouer.”
L’IA apprend les séquences de négociation qui lui sont favorables, et est donc encouragée à continuer à jouer et coopérer.
Cette application relève du champ de l’IA coopérative, un secteur encore peu exploré parce que nécessitant une puissance de calcul importante pour pouvoir appréhender l’ensemble des hypothèses combinatoires dans un échange multi-agents.
Les bonnes règles du jeu pour la bonne coopération
De très nombreux rounds de négociations ont ainsi été simulés, avec des résultats divers à la clé. Certaines règles du jeu sont propices à la coopération et à la bonne alternance dans les prises de quart. D’autres, biaisées, peuvent amener un agent/opérateur à exploiter une faille au détriment des autres acteurs. Le système étudié montre la diversité des situations possibles et atteste de la possibilité d’une coopération vertueuse sur la base de quatre métriques d’évaluation : efficacité (le nombre de kWh économisés), sureté (mesure les risques pour un agent lorsque les autres ne coopèrent pas), incitation à jouer (stimule la coopération en en exhibant le gain), équité (chaque acteur économise le même nombre de kWh). En prototypant ainsi les interactions entre opérateurs, il est possible de définir les meilleurs paramètres de négociation et de limiter les échanges au strict nécessaire, pour une duplication optimale dans la “vraie vie”.
D’ores et déjà, les travaux menés démontrent l’intérêt pour le plus grand nombre d’opérateurs à coopérer et mutualiser leurs ressources, en l’occurrence sur des périodes de faible activité.