L’IA qui prend des notes pour votre médecin peut raconter n’importe quoi
En analysant 20 outils d'IA destinés à la prise de notes médicales, des chercheurs se sont rendus compte qu'ils étaient loin d'être aussi efficaces qu'ils en ont l'air. Au point de représenter un danger potentiel pour les patients.

Puisque l'intelligence artificielle est partout, il n'est pas étonnant que les médecins s'en emparent pour faciliter leur travail. Nous ne parlons pas de ces IA capables de détecter des maladies à partir de presque rien en un temps record, mais simplement d'outils de prise de notes. Chaque fois qu'un patient vient consulter, le praticien doit écrire ce qui se dit puis entrer le tout dans son logiciel de suivi. Pour se décharger de ces deux tâches, certains ont choisi de faire confiance à l'IA.
La question est donc : ont-ils raison de s'en remettre à de tels logiciels ? Si l'on en croit les vendeurs, la réponse est évidemment oui. Ils mettent en avant des tests rigoureux démontrant la pertinence du programme, assurant qu'il permettra un gain de temps significatif. Aux États-Unis, les gouvernements locaux peuvent même l'approuver ou non, fournissant in fine une liste de ceux qui ont passé les évaluations requises avec succès. Le problème, c'est que ces dernières ne sont pas forcément adéquates.
Les outils IA utilisés par les médecins pour prendre des notes ont des problèmes
L'Office of the Auditor General of Ontario a analysé les 20 outils de prise de notes médicales par IA approuvés par l'État. Il a simulé deux conversations entre patient et docteur, avec un résultat effrayant. Tous les logiciels présente un souci.
À savoir : 17 ont manqué des détails cruciaux sur la santé mentale du patient, 12 ont mal enregistré des informations et 9 en ont halluciné d'autres.
Lire aussi – À l’hôpital, l’IA confond les organes et crée des complications lors d’opérations
L'organisme note que cela “pourrait déboucher sur des plans de traitement inadéquats ou préjudiciables, susceptibles d'avoir des répercussions sur l'état de santé des patients“. Exemples relevés : des résultats de prises de sang qui n'ont jamais eu lieu ou des noms de médicaments prescris mal retranscris.
Les outils testés ont obtenu un score de 12/20 sur la “précision des notes médicales générées“. Sauf que cette note ne représente que 4 % du score total dans la grille d'évaluation du gouvernement. Les auteurs de l'audit appellent donc à une refonte profonde de cette dernière.