Si vous savez répondre à cette question, vous êtes plus intelligent que ChatGPT

Par Thomas Povéda Le 14/06/2024 4 com's

Des chercheurs ont testé de nombreux modèles d'intelligence artificielle sur une question de logique simple et presque tous ont échoué. Parviendrez-vous à trouver la réponse ?

Un robot pensif devant un tableau rempli de formules mathématiques — Crédits : 123RF

À votre avis, l'intelligence artificielle est-elle supérieure aux êtres humains ? Il ne s'agit pas d'un sujet du bac de philosophie en avant-première, mais d'une question que l'on peut légitimement se poser quand on voit les progrès fulgurants de cette technologie. Dans certains domaines, c'en est même effrayant. L'IA obtient facilement son diplôme de médecine par exemple, et sert déjà à identifier des maladies que plusieurs experts ne parviennent pas à trouver. C'est bien simple : l'intelligence artificielle peut être plus humaine que nous.

Pourtant, une étude de l'organisation LAION montre que l'on est encore loin de la domination des machines. De nombreux modèles de langage ont été testés : GPT-3, GPT-4 et GPT-4o d'OpenAI, Claude 3 Opus d'Anthropic, Gemini de Google, Llama de Meta, Mixtral de Mistral… Le protocole de test est extrêmement simple puisqu'il s'agit de répondre à ce qu'on appelle le problème “Alice au pays des merveilles”. Presque toute ont échoué.

Les IA n'arrivent pas à répondre correctement à cette question de logique simple

Voici la question posée : “Alice a [X] frères et aussi [Y] sœurs. Combien de sœurs le frère d'Alice possède-t-il ?“. Plusieurs variantes sont utilisées, et les réponses des IA sont stupéfiantes. Llama 3 de Meta a eu droit à “Alice a quatre frères et une sœur” et il explique que chaque frère a… une seule sœur, Alice elle-même. Sauf qu'ils en ont bien 2 chacun, Alice et l'autre sœur mentionnée. Le pire, c'est que l'IA s'enfonce dans ses explications avec conviction.

Comme le note l'étude, “[…] les modèles expriment également une confiance excessive dans leurs solutions erronées, tout en fournissant des explications souvent absurdes […] pour justifier et étayer la validité de leurs réponses manifestement erronées, en les rendant plausibles“. Au final, seul GPT-4o s'en sort avec les honneurs en répondant juste dans 65 % des cas, selon les formulations choisies. Ces résultats sont d'autant plus étonnants que les modèles de langage testés obtiennent de bons scores de MMLU, pour “Multi-task Language Understanding”, qui évalue la capacité d'une IA à résoudre des problèmes. Les chercheurs n'expliquent pas ce décalage, mais pointent la nécessité de revoir les mesures.

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Voir tous les commentaires

Demandez nos derniers !

GTA 6 va bientôt refaire parler de lui, et c’est ce mode qui sera à l’honneur
Ça fait plus d’un an que la bande-annonce de GTA 6 a mis le feu aux réseaux, et depuis… le grand silence. Les joueurs commencent à checker leurs mails plus souvent que leur partie de GTA Online. La bonne nouvelle…

Jeux vidéo 28/04/2025
Cet appareil est dans l’espace depuis 35 ans et il est toujours en service, voici son incroyable histoire
Lancé en 1990, cet appareil a fêté le 24 avril ses 35 ans en orbite. Avec ses images du cosmos emblématiques et ses découvertes révolutionnaires, il a fondamentalement changé notre compréhension de l’Univers. Et surtout, il fonctionne toujours ! On…

Espace 28/04/2025
iPhone 17 : prix, fenêtre de sortie, nouveautés, design, tout savoir sur les prochains smartphones d’Apple
Certaines générations d’iPhone sont plus excitantes que d’autres, et celle de l’iPhone 17 fait clairement partie de celles que l’on va suivre avec attention. Tout nouveau modèle au design qui veut révolutionner l’industrie, remplacement du bloc photo iconique qui marquait…

iPhone 28/04/2025
Android : le réseau Find My Device se muscle (enfin) grâce à cette technologie
Perdre ses clés ou son portefeuille pourrait bientôt devenir un mauvais souvenir. Google prépare une mise à jour majeure pour son réseau Find My Device sur Android, avec un argument choc : une localisation ultra-précise et quatre fois plus rapide….

Applications 28/04/2025
Comment annuler votre abonnement Surfshark et vous faire rembourser ?
Surfshark est un VPN rapide, sécurisé et peu cher. Pour autant, vous pouvez annuler votre abonnement très facilement si vous le souhaitez, avec la possibilité de vous faire rembourser. On vous dit comment procéder. Surfshark est l’un des VPN les…

Comment ça marche 27/04/2025
Google Photos profite d’une nouvelle fonction, le déploiement de la mise à jour iOS 18.5 approche, c’est le récap’ de la semaine
La conversion de vos photos standards en Ultra HDR est désormais possible dans Google Photos, on fait le point sur les nouveautés proposées par Apple avec la mise à jour iOS 18.5, Windows continue d’inciter les utilisateurs à changer de…

Actualités 27/04/2025
Netflix dégaine les sous-titres minimalistes : adieu les « [porte qui grince] » !
Et si Netflix arrêtait de vous spoiler les scènes d’action avec des [musique inquiétante] ? La plateforme lance enfin des sous-titres allégés, pour ceux qui veulent juste suivre les dialogues… sans les bruits de pas ou les soupirs dramatiques. Saviez-vous…

Netflix 26/04/2025
Android 16 : cette nouvelle option de sécurité pourrait bien décourager les voleurs de smartphones
Perdre son téléphone, c’est stressant. Mais si en plus un inconnu pouvait pirater vos données via un câble USB… Android 16 a la solution : un mode qui transforme votre portable en forteresse verrouillée. Avec Android 16, Google renforce la…

Sécurité Android 26/04/2025
Nintendo Switch 2 : jeux XXL et mises à niveau payantes, l’addition risque de piquer
La Switch 2 débarque avec des jeux si gros qu’ils pourraient remplir votre console en un claquement de doigts… et votre portefeuille en deux temps trois mouvements. Préparez-vous à l’addition. Nintendo a officialisé les specs de sa Switch 2, et…

Nintendo 26/04/2025
One UI 7 est disponible sur les téléphones Samsung, on vous explique comment l’obtenir tout de suite
Samsung a débuté le déploiement de One UI 7, sa surcouche Android 15, pour ses anciens téléphones. Cette interface change beaucoup de choses et améliore considérablement la vie des utilisateurs. Si vous souhaitez l’installer maintenant, on vous explique comment procéder. …

Samsung 26/04/2025

Newsletter