ChatGPT n’est pas près de remplacer un vrai médecin, l’IA fait trop d’erreurs de diagnostic

ChatGPT, la célèbre IA générative, a été testé sur sa capacité à diagnostiquer des cas médicaux pédiatriques. Les résultats ne sont pas vraiment prometteurs, en particulier sur les maladies touchant les enfants.

Robot docteur
Crédit : 123RF

Une étude publiée cette semaine dans JAMA Pediatrics montre que ChatGPT-4, la dernière version du chatbot, n'a obtenu qu'un taux de précision de 17 % lorsqu'il a été confronté au diagnostic de 100 cas rares. Ce taux est bien inférieur aux 39 % de précision obtenus par le ChatGPT-3 lors d'un test similaire l'année dernière.

L'étude, menée par des chercheurs du Cohen Children's Medical Center de New York, met en évidence les limites et les difficultés de l'utilisation des chatbots d'IA pour des diagnostics complexes, en particulier pour les enfants. Les chercheurs soulignent que les cas pédiatriques nécessitent une plus grande attention à l'âge et au stade de développement du patient, ainsi que davantage de compétences en matière de communication pour obtenir les symptômes des enfants ou de leurs parents.

Lire égalementChatGPT sauve la vie d’un chien après le mauvais diagnostic d’un vétérinaire

ChatGPT est encore loin de pouvoir remplacer les médecins

Les chercheurs ont utilisé 100 cas pédiatriques publiés dans JAMA Pediatrics et NEJM entre 2013 et 2023. Ces cas ont été conçus pour tester les compétences diagnostiques des médecins, car ils impliquaient des conditions peu communes ou inhabituelles qui nécessitaient une analyse et un raisonnement minutieux. Les chercheurs ont transmis le texte des cas à ChatGPT et lui ont demandé de fournir un diagnostic. Deux médecins-chercheurs ont ensuite évalué les réponses du chatbot et les ont notées comme correctes, incorrectes ou partiellement correctes.

ChatGPT n'a eu raison que dans 17 cas, tandis qu'il a eu tort dans 72 cas et partiellement raison dans 11 cas. Les cas partiellement corrects sont ceux où ChatGPT a donné un diagnostic qui était lié au diagnostic correct, mais qui était trop vague ou trop général pour être considéré comme exact.

Les chercheurs ont également remarqué que ChatGPT avait du mal à identifier les relations entre différentes pathologies qu'un médecin humain reconnaîtrait facilement. Par exemple, ChatGPT n'a pas réussi à établir un lien entre l'autisme et le scorbut, qui sont tous deux associés à une carence en vitamine C. ChatGPT a également commis des erreurs liées au même système organique, en confondant par exemple les calculs rénaux et le cancer du rein.

Les chercheurs suggèrent que ChatGPT pourrait améliorer ses performances en étant formé en utilisant des textes médicaux, et en ayant accès à davantage de données médicales en temps réel. Nous avions déjà pu voir l’IA réussir à diagnostiquer une maladie que 17 médecins n’avaient pas reconnue, donc il n’est pas impossible que l’IA devienne plus compétente que certains docteurs d’ici quelques années.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Bon plan TV S95F : Samsung propose une grosse remise sur sa meilleure TV OLED

Samsung baisse fortement le prix de la TV OLED la plus avancée du moment. Le modèle S95F sorti l’année dernière est en promotion dans ses versions de 55 pouces et…

Discord a menti : les selfies vidéo pour vérifier son âge seront traités par un tiers

Discord a annoncé qu’un système de vérification de l’âge va être déployé sur la plateforme. Pour rassurer les utilisateurs, on nous promettait que les selfies vidéo nécessaires pour prouver sa…

Samsung prépare une nouveauté bien utile pour sa mise à jour One UI 9

Now Nudge pourrait bien devenir l’une des fonctions IA les plus populaires sur les smartphones Samsung. Elle ne sera pas prête pour One UI 8.5, mais devrait l’être pour One…

Galaxy S26 : Samsung promet des photos de nuit de toute beauté

Samsung compte sur l’IA pour que les Galaxy S26 capturent de belles photos lumineuses en toutes circonstances, même de nuit.  Après des mois de rumeurs, Samsung a enfin officialisé la…

Le Ninja CRISPi chute à moins de 90 € et atteint son prix le plus bas : c’est le moment ou jamais de craquer !

Le Ninja CRISPi est un airfryer innovant qui vous permet de chauffer vos plats directement dans des contenants en verre que vous pouvez ensuite utiliser pour stocker les restes. Il…

Voici pourquoi chaque éclipse solaire est suivie d’une éclipse lunaire

Les éclipses ne se produisent jamais au hasard. Elles suivent un cycle régulier, appelé saison des éclipses, qui revient deux fois par an. Lorsqu’une éclipse solaire se produit, une éclipse…

QuitGPT, le boycott de ChatGPT prend de l’ampleur sur fond de scandale

ChatGPT fait face à un boycott inédit lancé par un mouvement baptisé QuitGPT. En cause, des liens politiques et des contrats avec des agences gouvernementales. Des milliers d’utilisateurs affirment avoir…

IA

580 € de remise sur le Galaxy Z Fold 7 : belle chute de prix sur le smartphone pliable de Samsung

Le Galaxy Z Fold 7, l’un des smartphones pliables les plus populaires du marché voit son prix chuter de près de 600 € sur le site officiel de Samsung. La…

Encore une fuite de données chez Relais Colis, avec des dangers concrets pour les victimes

Relais Colis est victime d’une nouvelle intrusion dans ses systèmes, menant au vol de données personnelles de ses clients. On n’en voit plus le bout. Il y a quelques semaines,…

ChatGPT déjà en danger de mort ? Microsoft veut retirer son soutien à OpenAI

Microsoft va développer ses propres modèles d’IA au lieu de compter sur ceux d’OpenAI. Pourtant pionnière du secteur avec ChatGPT, l’avenir s’assombrit pour la société dirigée par Sam Altman. Fin…

IA