La disponibilité des données massives (Big Data) et l’augmentation de la puissance de calcul des machines dans ces dernières années ont débouché sur des avancées significatives dans le domaine de l’IA. Ces avancées ont soulevé une série de réflexions et débats, principalement spéculatifs, qui tentent d’anticiper et de cerner les conséquences et les apports de ces avancées dans le travail [Zouinar, 2020]. Ainsi, si certains expriment des craintes d’un remplacement généralisé des salariés par des systèmes à base d’IA, d’autres estiment que l’incidence majeure serait plutôt la reconfiguration que l’automatisation et la disparition massive des métiers [COE, 2017]. Une autre perspective qui s’oppose au remplacement consiste à mettre l’accent sur la complémentarité entre IA et humains : l’IA pourrait aider les travailleurs (par exemple, en prenant en charge des tâches répétitives ou fastidieuses, en facilitant la réalisation de tâches ou encore en « augmentant » leurs capacités d’action), de même que l’humain pourrait aider les systèmes d’IA à travers ce qu’il pourrait leur apprendre [Daugherty & Wilson, 2018]. Il existe encore peu d’études empiriques permettant de comprendre les usages effectifs des systèmes à base d’IA et leurs réelles conséquences dans des situations de travail.
Au-delà de ces réflexions prospectives, plusieurs questions se posent : comment ces systèmes sont-ils déployés et utilisés dans des situations réelles de travail ? Qu’est-ce qu’ils permettent de faire ? Concrètement, qu’est-ce que leur introduction change dans les activités professionnelles ? Quels enjeux et problématiques soulèvent-ils pour les travailleurs ? L’objectif de cet article est d’apporter des éléments de réponse à ces questions à travers deux études de cas dans le domaine de la radiologie particulièrement confronté à cette évolution technologique [Anichini & Geffroy, 2021].
Les deux études de cas montrent que les usages et le déploiement des systèmes d’IA ont des incidences variables, selon le type de système et le contexte organisationnel.
D’un point de vue méthodologique, une démarche qualitative, à base d’entretiens et d’observations, a été mise en place. Le premier cas s’intéresse à un système de dictée à Reconnaissance Vocale (RV) au sein d’un service d’imagerie médicale hospitalier (Figure 1). Le dispositif effectue une transcription automatique du texte dicté. Des entretiens et observations en situation réelle de travail ont été réalisés dans ce service auprès de différents professionnels : des médecins radiologues, des manipulateurs, des secrétaires mais aussi des informaticiens et des cadres de santé.
Le deuxième cas porte sur un système de Détection de Fractures (DF) (Figure 2) utilisé en radiologie conventionnelle (imagerie par rayons X). Plusieurs radiologues et quelques médecins urgentistes ont été interviewés et observés durant leur travail au sein de trois cabinets privés et trois centres hospitaliers qui sont des structures différentes de celle où le système de dictée RV a été étudié.
Le cas de la dictée à Reconnaissance Vocale (RV)
Le déploiement de la dictée RV dans le service d’imagerie concerné coïncide avec le projet de la réorganisation du secrétariat de ce service. La réorganisation est en lien direct avec la charge de travail élevée des secrétaires en termes de transcription des comptes-rendus (CR) radiologiques, dictés et enregistrés par les radiologues. Intégrée dans la nouvelle version de leur système d’archivage et de transmission d’images déployée au moment du projet de réorganisation du secrétariat, la dictée RV présentait l’opportunité de répondre à la problématique des retards importants au niveau de la transcription. La mise en place de ce système a nécessité de repenser l’organisation du travail. Si, avant sa mise en place, les secrétaires retranscrivaient et corrigeaient les CR enregistrés sur des cassettes ou en format numérique, c’est désormais le système de dictée qui réalise la tâche de transcription et le radiologue corrige souvent seul son CR (Figure 3). Cette nouvelle organisation du travail a notamment été guidée par l’objectif de gagner du temps dans le processus de production des CR.
Un gain de temps mais des difficultés d’usage pour les radiologues
L’utilisation de la dictée RV par un radiologue s’inscrit dans une activité plutôt complexe et itérative qui est la réalisation d’un CR. En vue d’analyser, croiser et synthétiser de nombreuses informations, cette activité implique de faire des allers-retours entre le cas clinique du patient, la demande et les interrogations du médecin demandeur d’examen radiologique et les images d’examen. Le compte-rendu se construit donc au fur et à mesure, en alternant l’analyse et la synthèse de ces différentes informations. Dans ce processus complexe, le radiologue peut se confronter à certaines difficultés d’utilisation de la dictée par reconnaissance vocale. Par exemple, il peut être amené à contrôler et corriger de manière systématique le texte transcrit. En effet, plusieurs radiologues ont exprimé un manque de performance du système : il s’agit de mots mal transcrits ou encore des fautes de grammaire. Les apprentissages du système – nécessaires pour son bon fonctionnement et l’amélioration de sa performance – s’avèrent plutôt contraignants pour certains d’entre eux. Tout d’abord, le radiologue doit configurer son profil vocal pour permettre au système de reconnaître sa voix. Mais ce qui est le plus problématique, ce sont certaines demandes de (re)configuration du profil vocal de la part du système qui n’arrivent pas toujours au moment opportun :
« Ce qui m’énerve aussi, c’est que très régulièrement il redemande d’enregistrer un texte pour reconnaître mon profil vocal (…) parfois ce n’est pas embêtant, mais parfois on a envie de démarrer l’ordinateur parce qu’on nous demande un avis au téléphone, et il y a ce truc qui se fait au démarrage. » (radiologue 1)
Malgré ces difficultés d’utilisation du système, plusieurs bénéfices ont été soulignés par les radiologues. Tout d’abord, il permet de supprimer les retards de transcription des CR, permettant ainsi d’améliorer la prise en charge des patients qui peuvent rapidement en disposer. Globalement, les étapes de relecture et correction du CR sont simplifiées par rapport à la situation antérieure où les allers-retours entre secrétaire et radiologue pouvaient prendre plusieurs jours. Un autre apport de l’utilisation de la dictée RV se manifesterait dans la mise en forme et la construction du CR lui-même. Autrement dit, avec l’interface de ce système, le radiologue peut désormais visualiser, adapter et mieux réorganiser ses idées en temps réel.
Un collectif transformé et un risque de dégradation de la qualité des CR
Mais la mise en place de la dictée RV n’est pas sans conséquences sur les activités et l’organisation du travail à un niveau plus global. En effet, ce système a ouvert des possibilités de réorganisation du travail face aux problématiques organisationnelles du service (la surcharge de travail et les retards de transcription). Sa mise en place a permis de redéfinir l’organisation du travail entre secrétaires et radiologues. La nouvelle organisation du travail a entraîné la disparition de la partie principale du travail des secrétaires, soit le travail de transcription des CR. Cette évolution a été mal vécue par certaines d’entre elles. Cette tâche – appelée “le travail de frappe” – contribuait au développement de leurs connaissances médicales :
« Même dans la maladie des gens, malgré le malheur et des choses très graves, on apprenait quand même des anomalies d’anatomie. On s’enrichissait. Aujourd’hui, on n’a plus cet enrichissement. » (secrétaire 1)
Des transformations sont aussi identifiables au niveau collectif : avant la dictée RV, un CR s’apparentait à une production collective des radiologues et secrétaires, à travers laquelle se construisait une relation ténue, notamment de confiance, entre ces deux acteurs. Dans la nouvelle configuration, d’après les interviewés, cette relation s’est perdue. Elle prend une autre forme et passe par d’autres tâches comme des échanges ponctuels ou la gestion et l’élaboration des plannings des radiologues par les secrétaires. Dans tous les cas, ceci transforme leur relation :
« C’était une relation de confiance aussi (…) on a tellement l’habitude de certaines formules avec des médecins, parce qu’on tape, toujours, à peu près les mêmes médecins (…) c’est relationnel aussi et ça, ça nous a manqué quand même. » (secrétaire 2).
Par ailleurs, le risque de la dégradation de la qualité des CR est évoqué par certains radiologues mais aussi des secrétaires qui constatent plusieurs problèmes de transcription. Par exemple, des mots mal reconnus qui peuvent modifier le sens des phrases ou les rendre inintelligibles. Ces problèmes de transcription peuvent ébranler le sentiment de « travail bien fait » des radiologues :
« Des fois, on peut laisser passer un truc qui ne veut absolument rien dire parce qu’on a relu mais on a les yeux fatigués et puis on a sauté une phrase, donc il part un truc mais horrible, qui ne veut rien dire (…) ça oblige à faire des comptes-rendus plus concentrés, avant je pouvais faire des belles phrases maintenant je n’en fais plus. » (radiologue 2)
En outre, cette tâche de relecture et la surveillance permanente du texte transcrit par le système aurait tendance à augmenter la charge de travail de ces radiologues.
Le cas du système de Détection de Fractures (DF)
Contrairement au système de dictée RV qui prend en charge la tâche de transcription automatique, le système de détection de fractures n’assure pas la réalisation d’une tâche en tant que telle. Il propose une analyse supplémentaire en vue de détecter la présence ou l’absence des fractures sur les images de la radiologie conventionnelle (à rayons X). De cette manière, il intervient dans l’interprétation des images à analyser. D’après les radiologues interviewés et observés pour ce deuxième cas, l’introduction et l’utilisation de ce système répondent à différents objectifs en lien avec des problématiques socio-organisationnelles et l’évolution de leur métier :
- suivre l’évolution, notamment technologique, de la radiologie, participer plutôt que de subir cette évolution, rester concurrentiel et attractif : « ne pas être à la traîne»;
- faire face à la problématique du manque de radiologues (particulièrement dans des centres hospitaliers) et l’augmentation de leur charge de travail, entraînant la dégradation des conditions de travail (avec un risque sur la santé et la performance), qui peut aboutir à des erreurs et à la baisse des performances dans l’interprétation des images et du diagnostic ;
- aider les médecins urgentistes pour une première lecture des images de la radiologie conventionnelle, qui ne sont pas toujours interprétées par des radiologues en raison de la surcharge d’activité.
Une confiance prudente envers le système et un risque de perte de temps dans le travail
En proposant une analyse automatique des images radiologiques, ce système fournit trois types d’informations qui sont remontées au radiologue sans nécessiter une manipulation spécifique : absence de fracture, doute sur une ou plusieurs fractures et présence d’une ou plusieurs fractures. Le radiologue infirme ou confirme l’analyse du système en quelques secondes. Or, ces informations ne le dispensent pas de l’interprétation qu’il doit réaliser (analyser l’ensemble des éléments pertinents, regarder l’ensemble des images, zoomer, dézoomer, etc.). Sans le système, le radiologue serait seul face aux images à juger quels éléments observer et dans quel ordre. Avec ce système, l’interprétation des images est souvent guidée et orientée par les informations qu’il fournit. En revanche, le radiologue reste toujours le seul à évaluer la pertinence de ces informations vis-à-vis du cas clinique et du questionnement du médecin demandeur. Sur ce point, il s’avère que les informations données par le système ne sont pas toujours utiles ou pertinentes. Par exemple, les doutes du système concerneraient souvent des lésions sans impact sur la prise en charge du patient. L’indication de ces éléments dans le compte-rendu dépend du jugement du radiologue vis-à-vis de la pertinence clinique du cas analysé. Certains expliquent ainsi qu’ils n’auraient pas prêté attention aux lésions détectés sans l’utilisation du système. Le cas des examens de contrôle de l’évolution des fractures est un autre exemple. Dans ce cas, le système détecte systématiquement une fracture. Il est donc performant mais non pertinent et utile pour le radiologue qui doit analyser et s’exprimer sur l’évolution de cette fracture et non sur sa présence.
L’utilisation du système soulève également des enjeux de confiance des radiologues envers lui. Cette confiance semble passer par plusieurs phases et se développer au fur et à mesure de l’utilisation du système, en le mettant à l’épreuve. Certains radiologues ont exprimé une tendance à d’abord interpréter les images de manière indépendante, puis vérifier les résultats du système. Pour certains, cette tendance s’estompe avec le temps quand ils commencent à connaître les performances et les limites du système : au lieu d’interpréter seuls les images, ils vont désormais consulter directement les résultats du système dans les cas où ils cherchent une ou plusieurs fractures et pour lesquels ils savent que le système est performant. Dès lors, les radiologues évoquent aussi le risque qu’à certains moments, cette confiance devienne une sur-confiance. Utiliser le système exige de garder le contrôle sur l’interprétation des images et de remettre en question les informations fournies pour éviter cet écueil. Pourtant, cette exigence fait surgir une autre problématique de perte de temps potentielle. C’est notamment le cas lors des faux positifs qui peuvent faire douter le radiologue. Ainsi, il aurait tendance à passer du temps à chercher, regarder les images et les zones indiquées par le système alors qu’en réalité il n’y a pas, par exemple, de fracture. Par ailleurs, le radiologue peut toujours réaliser des examens complémentaires (par exemple, scanner, échographie, etc.) en cas de discordance entre son avis, les résultats du système et le cas clinique du patient.
Dans la version « actuelle »[1] observée, le système ne peut détecter que des fractures, tandis qu’interpréter les images radiologiques signifie analyser de nombreux autres éléments en vue d’établir un diagnostic. En ce sens, le développement d’une confiance des radiologues envers le système comporte aussi un risque de négliger d’autres aspects des images et de rester focaliser sur les seules informations fournies par le système, comme l’explique ce radiologue : « des fois, on fait tellement confiance à [système DF] on ne regarde plus les luxations » (radiologue 3).
Tout en ayant conscience d’un risque de sur-confiance et de besoin de contrôle, pour certains radiologues, l’apport principal du système est de les protéger contre d’éventuels ratés dans l’interprétation des clichés. C’est pourquoi, ce système est majoritairement décrit comme « un filet de sécurité » ou « un second lecteur », permettant de réduire le stress du radiologue, induit par la peur de rater quelque chose sur les images (parfois difficiles et nombreuses à analyser) et les risques que cela soulève pour sa responsabilité. Le système trouverait ainsi sa place notamment dans des conditions dégradées du travail des radiologues comme le travail de nuit et en cas de fatigue.
Si, au départ, l’un des objectifs de l’utilisation du système est de gagner du temps dans le processus d’interprétation des images, ce gain est difficile à évaluer dans la pratique. En effet, les apports ne se traduisent pas systématiquement en gain de temps conséquent :
« Pour l’instant c’est presque une perte de temps dans le workflow, nous on l’utilise vraiment plus pour de la qualité qu’une accélération des choses. Parce que le modèle économique au départ était plutôt « on va faire gagner du temps aux radiologues », etc. Nous pour l’instant, on ne l’a pas vécu comme ça. » (radiologue 4)
Une aide potentielle pour les médecins urgentistes et les manipulateurs radio
Certes, l’organisation du travail des radiologues n’est pas directement transformée par la mise en place du système (au moment de nos observations), mais selon certains interviewés, ses fonctionnalités pourraient ouvrir des possibilités de réorganiser le travail des services d’urgences et de venir en aide aux médecins urgentistes. Par exemple, en cas de doute, au lieu d’attendre l’interprétation des images par un radiologue, le médecin urgentiste peut se référer aux résultats du système afin d’être conforté dans son diagnostic et prendre une décision thérapeutique adéquate. Des réflexions sont également proposées en termes d’accès aux résultats du système pour des manipulateurs radio pendant l’acquisition des images. L’objectif serait de permettre à ces manipulateurs d’alerter dans certains cas le radiologue sans attendre qu’il consulte les images de l’examen. Actuellement, ils peuvent certes le faire en cas d’urgences identifiées pendant l’acquisition des images, mais ce n’est pas systématique.
Conclusion
Les récentes avancées réalisées en IA ont soulevé de nombreuses questions concernant ses conséquences sur le travail et les organisations. Ces questions ont fait l’objet de nombreuses réflexions, principalement spéculatives, qui mettent l’accent soit sur des conséquences délétères soit sur les bénéfices. Les deux études empiriques présentées ici sur l’utilisation de la dictée à reconnaissance vocale et du système de détection de fractures dans le secteur de l’imagerie médicale nous permettent de nuancer et d’apporter des précisions à ces réflexions. Tout d’abord, les problématiques socio-organisationnelles apparaissent comme un élément majeur dans les motivations et les décisions d’introduire un système d’IA, qui ouvre souvent un champ de possibilités pour repenser les organisations du travail. La mise en place de ces systèmes n’est pas neutre et peut déboucher sur plusieurs transformations directes ou indirectes des activités de travail. Dans le cas de la radiologie, l’utilisation de la dictée RV par les radiologues et l’organisation du travail qui a été redéfinie occasionnent une modification de l’activité de construction d’un CR radiologique, se traduisant également par des conséquences non négligeables sur le travail des secrétaires (par exemple, perte du développement de compétences). Dans le cas du système DF, même si ce système n’intervient pas directement dans le diagnostic du radiologue, les informations qu’il fournit semble exercer une influence dans l’interprétation des images. Ainsi, les conséquences sont davantage de l’ordre de la transformation de certaines parties des activités plutôt que d’un « remplacement » des professionnels, par exemple des radiologues dont le travail d’interprétation des images ne peut se réduire à la seule détection des fractures.
Enfin, dans certaines situations, la mise en place et l’utilisation des systèmes d’IA semblent se confronter à deux paradoxes : (i) au lieu de faire gagner du temps, leur manque de performance ou une faible pertinence vis-à-vis du contexte de l’activité peut au contraire en faire perdre au travailleur lorsqu’il doit vérifier, contrôler et surveiller les résultats du système ; (ii) au lieu de permettre une amélioration de la qualité et de la performance, l’utilisation d’un système d’IA pourrait conduire à une augmentation de la charge de travail et à une diminution de la performance, introduisant des erreurs que la mise en place du système vise justement à réduire.
Les deux études de cas montrent ainsi que les usages et le déploiement des systèmes d’IA ont des incidences variables, selon le type de système et de contexte organisationnel. Contrairement aux promesses, ces incidences ne sont pas toujours bénéfiques. Ce qui souligne une fois de plus l’importance de les anticiper et les évaluer le plus en amont possible et au plus près du contexte de travail réel, en impliquant les acteurs concernés afin de coconstruire avec eux les transformations de leur travail. L’évaluation de ces incidences devrait être un processus continu dans les organisations, tout en gardant des possibilités de remettre en question à tout moment l’intérêt des systèmes d’IA dans les activités de travail concernées.
[1] Le système DF est amené à évoluer, en intégrant d’autres fonctionnalités telles que la détection d’autres anomalies, par exemple des luxations.
Sources :
Anichini, G. & Geffroy, B, « L’intelligence artificielle à l’épreuve des savoirs tacites. Analyse des pratiques d’utilisation d’un outil d’aide à la détection en radiologie », Sciences sociales et santé, 39(2), 2021, pp. 43-69.
COE, Automatisation, numérisation et emploi. Tome 1 : Les impacts sur le volume, la structure et la localisation de l’emploi, 2017, Paris.
Daugherty,P.R. & Wilson,J. Humans + Machine: Reimagining Work in the Age of AI, 2018, Harvard Business Review Press, Boston.
Zouinar, M. « Évolutions de l’Intelligence Artificielle : quels enjeux pour l’activité humaine et la relation Humain‑Machine au travail ? », @ctivités, 17-1, 2020.