Si vous savez répondre à cette question, vous êtes plus intelligent que ChatGPT

Des chercheurs ont testé de nombreux modèles d'intelligence artificielle sur une question de logique simple et presque tous ont échoué. Parviendrez-vous à trouver la réponse ?

Un robot pensif devant un tableau rempli de formules mathématiques
Crédits : 123RF

À votre avis, l'intelligence artificielle est-elle supérieure aux êtres humains ? Il ne s'agit pas d'un sujet du bac de philosophie en avant-première, mais d'une question que l'on peut légitimement se poser quand on voit les progrès fulgurants de cette technologie. Dans certains domaines, c'en est même effrayant. L'IA obtient facilement son diplôme de médecine par exemple, et sert déjà à identifier des maladies que plusieurs experts ne parviennent pas à trouver. C'est bien simple : l'intelligence artificielle peut être plus humaine que nous.

Pourtant, une étude de l'organisation LAION montre que l'on est encore loin de la domination des machines. De nombreux modèles de langage ont été testés : GPT-3, GPT-4 et GPT-4o d'OpenAI, Claude 3 Opus d'Anthropic, Gemini de Google, Llama de Meta, Mixtral de Mistral… Le protocole de test est extrêmement simple puisqu'il s'agit de répondre à ce qu'on appelle le problème “Alice au pays des merveilles”. Presque toute ont échoué.

Les IA n'arrivent pas à répondre correctement à cette question de logique simple

Voici la question posée : “Alice a [X] frères et aussi [Y] sœurs. Combien de sœurs le frère d'Alice possède-t-il ?“. Plusieurs variantes sont utilisées, et les réponses des IA sont stupéfiantes. Llama 3 de Meta a eu droit à “Alice a quatre frères et une sœur” et il explique que chaque frère a… une seule sœur, Alice elle-même. Sauf qu'ils en ont bien 2 chacun, Alice et l'autre sœur mentionnée. Le pire, c'est que l'IA s'enfonce dans ses explications avec conviction.

Lire aussi – Cette IA peut créer un robot qui marche en 26 secondes, Terminator en approche ?

Comme le note l'étude, “[…] les modèles expriment également une confiance excessive dans leurs solutions erronées, tout en fournissant des explications souvent absurdes […] pour justifier et étayer la validité de leurs réponses manifestement erronées, en les rendant plausibles“. Au final, seul GPT-4o s'en sort avec les honneurs en répondant juste dans 65 % des cas, selon les formulations choisies. Ces résultats sont d'autant plus étonnants que les modèles de langage testés obtiennent de bons scores de MMLU, pour “Multi-task Language Understanding”, qui évalue la capacité d'une IA à résoudre des problèmes. Les chercheurs n'expliquent pas ce décalage, mais pointent la nécessité de revoir les mesures.


Réagissez à cet article !

Demandez nos derniers articles !

Shark ChillPill : le ventilateur brumisateur portable passe à prix cassé pour les soldes, mais les stocks sont bientôt épuisés !

Vous cherchez un petit ventilateur brumisateur portable pour supporter les fortes chaleurs ? Le Shark ChillPill est un modèle puissant qui vous permet d’abaisser la température ressentie de 9 degrés…

GTA 6 va peser une tonne, voici comment gagner de la place sur votre PS5 ou Xbox Series

GTA 6 va peser dans l’histoire du jeu vidéo… Et ce, dans tous les sens du terme. En effet, il y a fort à parier que le titre de Rockstar…

Netflix complique encore le partage de compte avec cette nouvelle contrainte

Netflix exige désormais que chaque utilisateur d’un compte partagé fournisse son adresse email. Chaque profil du compte doit donc être associé à un email. En 2023, Netflix mettait fin au…

Test Xiaomi 17T : ce smartphone est-il seulement le « maître du téléobjectif » autoproclamé ?

Moins d’un an après la sortie du Xiaomi 15T, il est déjà temps d’accueillir son successeur : le Xiaomi 17T. Plus compact que son prédécesseur, il est aussi une version « allégée »…

Dreame L40s Pro Ultra : avec cette grosse chute de prix, l’aspirateur robot devient plus abordable !

Vous cherchez un aspirateur robot à double serpillère qui reste accessible en termes de prix ? Pour ce dernier jour du Prime Day, Amazon affiche une très belle promotion sur…

YouTube Shorts fait le plein de nouveautés, dont un mode plein écran

YouTube annonce de nouvelles fonctionnalités pour ses Shorts, entre meilleure expérience de visionnage et contrôle de la vitesse de lecture. Les amateurs de Shorts peuvent se réjouir, YouTube intègre de…

La caméra de surveillance Mi 360° Home Security Camera 2K est à petit prix pour quelques heures encore !

Vous souhaitez garder un œil à l’intérieur de votre maison quand vous n’êtes pas là ? La marque Xiaomi propose un modèle de grande qualité pour un tout petit prix…

Windows 10 obtient un nouveau sursis : des mises à jour gratuites seront disponibles jusqu’à cette date

Microsoft a encore décidé de repousser la date de fin du support logiciel de Windows 10. Face aux pressions, l’éditeur a octroyé un nouveau délai aux utilisateurs. Après des mois…

Cette mise à jour Tesla pourrait vous éviter de graves blessures lors d’un accident

La sécurité automobile se joue parfois à quelques millièmes de seconde. Tesla compte bien exploiter ce laps de temps minuscule avec une nouvelle approche. La marque déploie une mise à…

Vélos électriques Fiido : ces 3 nouveaux modèles remplacent votre voiture et votre équipement de rando

Un VAE capable de tenir 225 km sur une charge et deux cargos familiaux pour en finir avec la deuxième voiture : Fiido lance trois nouveaux modèles. Et si votre…