ChatGPT n’est pas près de remplacer un vrai médecin, l’IA fait trop d’erreurs de diagnostic

ChatGPT, la célèbre IA générative, a été testé sur sa capacité à diagnostiquer des cas médicaux pédiatriques. Les résultats ne sont pas vraiment prometteurs, en particulier sur les maladies touchant les enfants.

Robot docteur
Crédit : 123RF

Une étude publiée cette semaine dans JAMA Pediatrics montre que ChatGPT-4, la dernière version du chatbot, n'a obtenu qu'un taux de précision de 17 % lorsqu'il a été confronté au diagnostic de 100 cas rares. Ce taux est bien inférieur aux 39 % de précision obtenus par le ChatGPT-3 lors d'un test similaire l'année dernière.

L'étude, menée par des chercheurs du Cohen Children's Medical Center de New York, met en évidence les limites et les difficultés de l'utilisation des chatbots d'IA pour des diagnostics complexes, en particulier pour les enfants. Les chercheurs soulignent que les cas pédiatriques nécessitent une plus grande attention à l'âge et au stade de développement du patient, ainsi que davantage de compétences en matière de communication pour obtenir les symptômes des enfants ou de leurs parents.

Lire égalementChatGPT sauve la vie d’un chien après le mauvais diagnostic d’un vétérinaire

ChatGPT est encore loin de pouvoir remplacer les médecins

Les chercheurs ont utilisé 100 cas pédiatriques publiés dans JAMA Pediatrics et NEJM entre 2013 et 2023. Ces cas ont été conçus pour tester les compétences diagnostiques des médecins, car ils impliquaient des conditions peu communes ou inhabituelles qui nécessitaient une analyse et un raisonnement minutieux. Les chercheurs ont transmis le texte des cas à ChatGPT et lui ont demandé de fournir un diagnostic. Deux médecins-chercheurs ont ensuite évalué les réponses du chatbot et les ont notées comme correctes, incorrectes ou partiellement correctes.

ChatGPT n'a eu raison que dans 17 cas, tandis qu'il a eu tort dans 72 cas et partiellement raison dans 11 cas. Les cas partiellement corrects sont ceux où ChatGPT a donné un diagnostic qui était lié au diagnostic correct, mais qui était trop vague ou trop général pour être considéré comme exact.

Les chercheurs ont également remarqué que ChatGPT avait du mal à identifier les relations entre différentes pathologies qu'un médecin humain reconnaîtrait facilement. Par exemple, ChatGPT n'a pas réussi à établir un lien entre l'autisme et le scorbut, qui sont tous deux associés à une carence en vitamine C. ChatGPT a également commis des erreurs liées au même système organique, en confondant par exemple les calculs rénaux et le cancer du rein.

Les chercheurs suggèrent que ChatGPT pourrait améliorer ses performances en étant formé en utilisant des textes médicaux, et en ayant accès à davantage de données médicales en temps réel. Nous avions déjà pu voir l’IA réussir à diagnostiquer une maladie que 17 médecins n’avaient pas reconnue, donc il n’est pas impossible que l’IA devienne plus compétente que certains docteurs d’ici quelques années.


Réagissez à cet article !

Demandez nos derniers articles !

AliExpress dévoile une avalanche de promotions avec de nouveaux codes, les prix cassés sont au rendez-vous

Les opérations promotionnelles reprennent chez AliExpress. En parallèle des soldes, la plateforme casse le prix de nombreux produits high-tech avec des remises immédiates auxquelles s’ajoutent des codes promo cumulables. Smartphones,…

Nouveautés Netflix juillet 2026 : les séries et films à regarder

Chaque mois nous vous proposons de faire le point sur les séries et films proposés par Netflix. Nouveautés, documentaires, nous vous proposons également un top 3 des séries et des films à suivre. Prêts ? Bingez !

Spider-Man Brand New Day : histoire, casting, date de sortie, tout ce qu’on sait sur le prochain Marvel avec Tom Holland

Tom Holland revient en 2026 dans la peau de l’Homme-Araignée pour une nouvelle aventure. Date de sortie, casting, scénario, on vous dit ce qu’il faut savoir sur Spider-Man Brand New…

Test JBL Live Flex 4 : la nouvelle alternative séduisante aux Galaxy Buds4 et aux AirPods 4

Alors que Samsung et Apple misent sur des écouteurs semi-ouverts aux fonctions exclusives à leur écosystème maison, JBL vient proposer une alternative plutôt séduisante : les JBL Live Flex 4.  Conçus…

Crise de la RAM : une plainte collective accuse les fabricants de mémoire d’avoir délibérément fait exploser les prix

Trop, c’est trop : face à la montée sans précédent des prix de la mémoire, un groupe de consommateurs et de professionnels ont décidé de s’allier pour porter plainte contre…

Xiaomi préparerait une supercar électrique, les photos de ce coupé camouflé à l’aileron géant ne mentent pas

Une Xiaomi inconnue vient d’être surprise en plein test sur une autoroute chinoise. Son camouflage intégral et son aileron démesuré trahissent une supercar électrique hors norme. Jamais la marque ne…

On connait la date de lancement de l’iPhone 18 Pro et de l’iPhone pliable

La traditionnelle keynote de rentrée d’Apple est datée. L’événement sera particulier cette année. L’iPhone 18 y sera absent, seuls les modèles Pro seront présentés. Et pour la première fois, un…

Une recharge sans fil 50 W universelle sera bientôt disponible pour tous les smartphones

La norme Qi devrait prochainement évoluer pour offrir une solution de recharge sans fil universelle d’une puissance atteignant les 50 W. Xiaomi serait particulièrement impliqué dans sa conception. La recharge…

Soldes Dreame H12 Pro Ultra : l’aspirateur laveur de sol est de retour à petit prix, c’est l’indispensable du ménage !

Le ménage est une corvée dont on se passerait bien. Pour vous faciliter la tâche, le Dreame H12 Pro Ultra vous offre un nettoyage optimal en un seul passage. Et…

Xiaomi 18 : la fiche technique se précise, la batterie s’améliore

On commence à avoir une bonne idée de ce que va proposer le Xiaomi 18 en termes de caractéristiques techniques. La capacité de la batterie devrait être légèrement revue à…