ChatGPT n’est pas près de remplacer un vrai médecin, l’IA fait trop d’erreurs de diagnostic

ChatGPT, la célèbre IA générative, a été testé sur sa capacité à diagnostiquer des cas médicaux pédiatriques. Les résultats ne sont pas vraiment prometteurs, en particulier sur les maladies touchant les enfants.

Robot docteur
Crédit : 123RF

Une étude publiée cette semaine dans JAMA Pediatrics montre que ChatGPT-4, la dernière version du chatbot, n'a obtenu qu'un taux de précision de 17 % lorsqu'il a été confronté au diagnostic de 100 cas rares. Ce taux est bien inférieur aux 39 % de précision obtenus par le ChatGPT-3 lors d'un test similaire l'année dernière.

L'étude, menée par des chercheurs du Cohen Children's Medical Center de New York, met en évidence les limites et les difficultés de l'utilisation des chatbots d'IA pour des diagnostics complexes, en particulier pour les enfants. Les chercheurs soulignent que les cas pédiatriques nécessitent une plus grande attention à l'âge et au stade de développement du patient, ainsi que davantage de compétences en matière de communication pour obtenir les symptômes des enfants ou de leurs parents.

Lire égalementChatGPT sauve la vie d’un chien après le mauvais diagnostic d’un vétérinaire

ChatGPT est encore loin de pouvoir remplacer les médecins

Les chercheurs ont utilisé 100 cas pédiatriques publiés dans JAMA Pediatrics et NEJM entre 2013 et 2023. Ces cas ont été conçus pour tester les compétences diagnostiques des médecins, car ils impliquaient des conditions peu communes ou inhabituelles qui nécessitaient une analyse et un raisonnement minutieux. Les chercheurs ont transmis le texte des cas à ChatGPT et lui ont demandé de fournir un diagnostic. Deux médecins-chercheurs ont ensuite évalué les réponses du chatbot et les ont notées comme correctes, incorrectes ou partiellement correctes.

ChatGPT n'a eu raison que dans 17 cas, tandis qu'il a eu tort dans 72 cas et partiellement raison dans 11 cas. Les cas partiellement corrects sont ceux où ChatGPT a donné un diagnostic qui était lié au diagnostic correct, mais qui était trop vague ou trop général pour être considéré comme exact.

Les chercheurs ont également remarqué que ChatGPT avait du mal à identifier les relations entre différentes pathologies qu'un médecin humain reconnaîtrait facilement. Par exemple, ChatGPT n'a pas réussi à établir un lien entre l'autisme et le scorbut, qui sont tous deux associés à une carence en vitamine C. ChatGPT a également commis des erreurs liées au même système organique, en confondant par exemple les calculs rénaux et le cancer du rein.

Les chercheurs suggèrent que ChatGPT pourrait améliorer ses performances en étant formé en utilisant des textes médicaux, et en ayant accès à davantage de données médicales en temps réel. Nous avions déjà pu voir l’IA réussir à diagnostiquer une maladie que 17 médecins n’avaient pas reconnue, donc il n’est pas impossible que l’IA devienne plus compétente que certains docteurs d’ici quelques années.


Réagissez à cet article !

Demandez nos derniers articles !

Android 17 : Google s’inspire encore d’Apple pour fluidifier l’échange de fichiers via Quick Share

Google n’agit pas seulement pour l’interopérabilité entre Quick Share et AirDrop pour simplifier le partage de fichiers, il s’inspire également de la solution d’Apple pour améliorer la sienne. Probablement en…

Apple planche sur un nouvel iMac avec écran OLED

Apple se serait rapproché de plusieurs fournisseurs d’écran du marché pour la conception d’un affichage OLED à destination d’un futur iMac. Après l’iPhone et l’iPad, Apple s’apprête à adopter l’OLED…

PC

Pour ce dirigeant d’Apple, l’iPhone existera encore dans un demi-siècle

L’iPhone va-t-il disparaître ? Pas de sitôt, selon Apple. Greg Joswiak, directeur marketing de la firme, affirme que le smartphone sera toujours là dans 50 ans. Il contredit pourtant directement…

300 € de remise sur le nouveau MacBook Air M5 : Boulanger lâche déjà une offre ultra agressive

À peine lancé, le MacBook Air M5 (2026) voit déjà son prix chuter fortement. Boulanger propose jusqu’à 300 € de remise grâce à une offre combinée. Voici comment en profiter…

Bouygues Telecom : fini de se disputer pour savoir quoi regarder à la télé, cette offre met tout le monde d’accord

Qui n’a jamais eu à débattre avec ses enfants ou ses parents pour savoir qui décide ce qu’on regarde à la télévision ? Ce problème fait désormais partie du passé,…

Pixel 10 Pro XL : plus de 500 € de réduction sur le meilleur smartphone de Google, vite !

Si vous cherchez un smartphone haut de gamme boosté par une IA vraiment performante et qui fait des photos de qualité professionnelle, le Pixel 10 Pro XL est un excellent…

Nouveautés Netflix avril 2026 : les séries et films à regarder

Chaque mois nous vous proposons de faire le point sur les séries et films proposés par Netflix. Nouveautés, documentaires, nous vous proposons également un top 3 des séries et des films à suivre. Prêts ? Bingez !

Android Auto se dote enfin d’un player YouTube, mais pas exactement celui que vous voulez

Plusieurs utilisateurs d’Android Auto rapportent avoir récemment reçu une mise à jour qui apporte un véritable player YouTube à l’interface. S’agit-il enfin d’une application à part entière promise de longue…

Android Auto : fini la musique qui se lance toute seule, Google prépare une meilleure solution pour désactiver la lecture automatique

Si pour certains conducteurs la musique au volant est quelque chose de crucial, d’autres s’en passent bien volontiers. Alors évidemment, la fonction de lecture automatique d’Android Auto est loin d’être…

Samsung Galaxy S : la compatibilité avec AirDrop arrive très bientôt, même pour les smartphones plus anciens

Plusieurs utilisateurs rapportent avoir reçu une nouvelle mise à jour de Quick Share sur leur smartphone Galaxy, apportant la compatibilité avec AirDrop des iPhone. Il semblerait donc que même les…