ChatGPT n’est pas près de remplacer un vrai médecin, l’IA fait trop d’erreurs de diagnostic

ChatGPT, la célèbre IA générative, a été testé sur sa capacité à diagnostiquer des cas médicaux pédiatriques. Les résultats ne sont pas vraiment prometteurs, en particulier sur les maladies touchant les enfants.

Robot docteur
Crédit : 123RF

Une étude publiée cette semaine dans JAMA Pediatrics montre que ChatGPT-4, la dernière version du chatbot, n'a obtenu qu'un taux de précision de 17 % lorsqu'il a été confronté au diagnostic de 100 cas rares. Ce taux est bien inférieur aux 39 % de précision obtenus par le ChatGPT-3 lors d'un test similaire l'année dernière.

L'étude, menée par des chercheurs du Cohen Children's Medical Center de New York, met en évidence les limites et les difficultés de l'utilisation des chatbots d'IA pour des diagnostics complexes, en particulier pour les enfants. Les chercheurs soulignent que les cas pédiatriques nécessitent une plus grande attention à l'âge et au stade de développement du patient, ainsi que davantage de compétences en matière de communication pour obtenir les symptômes des enfants ou de leurs parents.

Lire égalementChatGPT sauve la vie d’un chien après le mauvais diagnostic d’un vétérinaire

ChatGPT est encore loin de pouvoir remplacer les médecins

Les chercheurs ont utilisé 100 cas pédiatriques publiés dans JAMA Pediatrics et NEJM entre 2013 et 2023. Ces cas ont été conçus pour tester les compétences diagnostiques des médecins, car ils impliquaient des conditions peu communes ou inhabituelles qui nécessitaient une analyse et un raisonnement minutieux. Les chercheurs ont transmis le texte des cas à ChatGPT et lui ont demandé de fournir un diagnostic. Deux médecins-chercheurs ont ensuite évalué les réponses du chatbot et les ont notées comme correctes, incorrectes ou partiellement correctes.

ChatGPT n'a eu raison que dans 17 cas, tandis qu'il a eu tort dans 72 cas et partiellement raison dans 11 cas. Les cas partiellement corrects sont ceux où ChatGPT a donné un diagnostic qui était lié au diagnostic correct, mais qui était trop vague ou trop général pour être considéré comme exact.

Les chercheurs ont également remarqué que ChatGPT avait du mal à identifier les relations entre différentes pathologies qu'un médecin humain reconnaîtrait facilement. Par exemple, ChatGPT n'a pas réussi à établir un lien entre l'autisme et le scorbut, qui sont tous deux associés à une carence en vitamine C. ChatGPT a également commis des erreurs liées au même système organique, en confondant par exemple les calculs rénaux et le cancer du rein.

Les chercheurs suggèrent que ChatGPT pourrait améliorer ses performances en étant formé en utilisant des textes médicaux, et en ayant accès à davantage de données médicales en temps réel. Nous avions déjà pu voir l’IA réussir à diagnostiquer une maladie que 17 médecins n’avaient pas reconnue, donc il n’est pas impossible que l’IA devienne plus compétente que certains docteurs d’ici quelques années.


Réagissez à cet article !

Demandez nos derniers articles !

IA : pourquoi une startup veut mettre des puces Nvidia dans les lampadaires

Une startup anglaise a une idée originale pour limiter l’impact environnemental des centres de données dédiés à l’intelligence artificielle. Elle repose sur l’utilisation du mobilier urbain et de l’énergie solaire….

IA

Google Home : 5 ans après le dernier Nest Hub, un nouvel écran connecté enfin en préparation ?

La refonte majeure de Google Home ne se joue pas uniquement sur le terrain logiciel avec Gemini : l’entreprise avait déjà annoncé de nouveaux produits en octobre dernier. Mais Google pourrait…

L’IA qui prend des notes pour votre médecin peut raconter n’importe quoi

En analysant 20 outils d’IA destinés à la prise de notes médicales, des chercheurs se sont rendus compte qu’ils étaient loin d’être aussi efficaces qu’ils en ont l’air. Au point…

IA

Un chercheur furieux rend publique une faille qui neutralise les protections de Windows 11

Un chercheur en sécurité mécontent vient de rendre publique une faille non corrigée dans Windows 11. Elle permet de contourner BitLocker, le système de chiffrement censé protéger les données des…

La nouvelle manette de Xbox pensée pour le cloud se dévoile en images et corrige l’un des plus défauts de ses homologues

Cette fois il semblerait que ce soit la bonne : le média Technoblog a dévoilé des photos volées de la prochaine manette Xbox pensée pour le cloud gaming. Malgré son…

Et si on cherchait mal les extraterrestres ? Cette méthode inédite pourrait complètement changer la donne

La quête de la vie extraterrestre pourrait prendre un nouveau tournant. La nature des biosignatures ne suffisant pas, certains des composés recherchés pouvant être produits par des processus non vivants,…

Voici pourquoi le PDG de Volkswagen vient de condamner la Golf électrique

Volkswagen repousse la Golf électrique à la fin de la décennie. Le PDG du constructeur allemand vient de le confirmer sans détour. Une icône de l’automobile devra donc encore patienter…

Plus de 100 Mo pour une photo ? La caméra du Xiaomi 17 Max s’annonce très gourmande en stockage

Le capteur photo de 200 MP du Xiaomi 17 Max produirait des fichiers supérieurs à 100 Mo pour un seul cliché. De quoi mettre à l’épreuve l’espace de stockage du…

Gmail réduit l’espace de stockage gratuit de 15 à 5 Go si vous ne respectez pas cette condition

Google offre depuis bien longtemps 15 Go d’espace de stockage à ses utilisateurs pour leur compte Gmail. Mais l’entreprise se montrerait moins généreuse récemment, à moins de lui donner votre…

Instagram lance Instants, pour des photos spontanées et sans filtre à la BeReal

Instagram lance à la fois une nouvelle fonction intégrée à son app principale et une application dédiée pour Instants, sa fonctionnalité de partage de photos spontanées et sans filtre. Il…