● À la différence de ce qui se passe avec ChatGPT, LightOn prévoit de garantir sécurité des données et souveraineté numérique en déployant ses services sur site et non dans le cloud.
● Pour Laurent Daudet, de nouvelles spécialités en IA générative se développent en entreprise, dans les ressources humaines, en marketing, en ventes, etc. Un véritable décloisonnement des services informatiques.
LightOn revendique avoir créé un outil d’IA générative uniquement dédié aux entreprises. Comment est né ce projet ?
Au début, nous étions quatre sur un projet de recherche mêlant des compétences en acoustique et photonique et nous cherchions à comprendre comment le machine learning pouvait aider l’imagerie. Nous avons fini par concevoir une manière originale de faire des calculs et inventer un processeur photonique. Par la suite, nous avons conçu un premier modèle de langue que nous avons fait tourner sur le calculateur Jean-Zay, baptisé Pagnol. Au même moment, Jean Zay a reçu la demande d’Hugging Face qui a pris le lead sur le développement de Bloom, qui est un magnifique projet de recherche, mais il n’est pas pensé pour passer en production en entreprise.
Quand OpenAI a sorti GPT3, qui sait réaliser des tâches sur lesquelles il n’est pas entraîné, on s’est rendu compte que tous les métiers à base de texte allaient être impactés. On a donc pivoté à l’été 2020 et nous avons conçu un modèle propriétaire qui a 40 milliards de paramètres. Ce projet n’était pas censé devenir un produit, mais des entreprises nous ont rapidement demandé de l’intégrer.
Des experts IA apparaissent dans différentes business unit chez nos clients, qu’il s’agisse des RH ou en approvisionnement
Qu’est-ce qui peut être totalement automatisé dans les entreprises ?
Les demandes sont diverses, car les entreprises cherchent des gains de productivité sur des fonctions variées comme le marketing, les ressources humaines, les ventes et même la R&D. Par exemple, les larges modèles de langue sont plus subtils pour appréhender le contexte d’une interaction qu’un système marketing traditionnel. Cela fonctionne comme un chatbot avec du contexte et ces systèmes, par exemple sur un service client, sont capables de classifier les demandes des usagers en fonction des interactions précédentes avec eux et, donc, de disposer d’un contexte.
Il est intéressant de voir qu’il y a des experts IA qui apparaissent dans différentes business unit chez nos clients, qu’il s’agisse des RH ou en approvisionnement. On comprend que l’IA n’est plus l’affaire des directeurs des systèmes d’information (DSI). Nous accompagnons également les entreprises de services du numérique (ESN) qui ont besoin d’être à jour sur ces sujets. Mais notre modèle économique reste la licence logicielle.
Quel est l’avantage d’un outil d’IA génératif comparé aux outils qui étaient jusqu’alors utilisés en entreprise ?
Ce type d’outil peut également fonctionner même si la donnée n’est pas structurée. Si cela ne fonctionne pas, on peut lui montrer des exemples et il comprend ensuite les schémas, tandis que dans le deep learning traditionnel, il fallait fournir un volume d’exemples colossal. Parfois, il est nécessaire de réentraîner légèrement le modèle, ce qui permet d’optimiser la prédiction de texte. On atteint désormais des volumes de données colossaux, car ces entraînements sont réalisés sur des données non annotées.
Pour arriver à ce type de résultat, notre modèle a été entraîné sur Common Crawl [un index de plus de 5 milliards de pages Internet, ndlr], ce qui représente un corpus de 500 milliards de mots. Nous avons ensuite perfectionné notre modèle en supprimant tout ce qui n’est pas du texte, tous les contenus publicitaires, les contenus violents ou pour adultes et les contenus dupliqués. Il faut que le modèle ne voie qu’une seule fois la donnée pour ne pas être biaisé.
Qu’est-ce qui vous différencie de ChatGPT ?
D’une part, on permet aux entreprises de maîtriser leurs coûts : les sociétés qui utilisent ChatGPT n’ont pas idée de ce qu’elles vont payer à la fin du mois tandis que nous commercialisons nos services sous forme de licence logicielle. Par ailleurs, nous offrons un service dédié aux entreprises en leur garantissant la confidentialité des données. Sur les outils concurrents, les clients n’ont pas de choix en matière de sécurité et de gouvernance des données. C’est pourtant crucial pour des métiers comme la banque, l’assurance, la tech et évidemment pour le secteur médical. Notre architecture baptisée Paradigm est donc déployée sur site, dans les infrastructures du client, à la différence d’OpenAI qui propose une solution dans le cloud.