Si vous savez répondre à cette question, vous êtes plus intelligent que ChatGPT

Des chercheurs ont testé de nombreux modèles d'intelligence artificielle sur une question de logique simple et presque tous ont échoué. Parviendrez-vous à trouver la réponse ?

Un robot pensif devant un tableau rempli de formules mathématiques
Crédits : 123RF

À votre avis, l'intelligence artificielle est-elle supérieure aux êtres humains ? Il ne s'agit pas d'un sujet du bac de philosophie en avant-première, mais d'une question que l'on peut légitimement se poser quand on voit les progrès fulgurants de cette technologie. Dans certains domaines, c'en est même effrayant. L'IA obtient facilement son diplôme de médecine par exemple, et sert déjà à identifier des maladies que plusieurs experts ne parviennent pas à trouver. C'est bien simple : l'intelligence artificielle peut être plus humaine que nous.

Pourtant, une étude de l'organisation LAION montre que l'on est encore loin de la domination des machines. De nombreux modèles de langage ont été testés : GPT-3, GPT-4 et GPT-4o d'OpenAI, Claude 3 Opus d'Anthropic, Gemini de Google, Llama de Meta, Mixtral de Mistral… Le protocole de test est extrêmement simple puisqu'il s'agit de répondre à ce qu'on appelle le problème “Alice au pays des merveilles”. Presque toute ont échoué.

Les IA n'arrivent pas à répondre correctement à cette question de logique simple

Voici la question posée : “Alice a [X] frères et aussi [Y] sœurs. Combien de sœurs le frère d'Alice possède-t-il ?“. Plusieurs variantes sont utilisées, et les réponses des IA sont stupéfiantes. Llama 3 de Meta a eu droit à “Alice a quatre frères et une sœur” et il explique que chaque frère a… une seule sœur, Alice elle-même. Sauf qu'ils en ont bien 2 chacun, Alice et l'autre sœur mentionnée. Le pire, c'est que l'IA s'enfonce dans ses explications avec conviction.

Lire aussi – Cette IA peut créer un robot qui marche en 26 secondes, Terminator en approche ?

Comme le note l'étude, “[…] les modèles expriment également une confiance excessive dans leurs solutions erronées, tout en fournissant des explications souvent absurdes […] pour justifier et étayer la validité de leurs réponses manifestement erronées, en les rendant plausibles“. Au final, seul GPT-4o s'en sort avec les honneurs en répondant juste dans 65 % des cas, selon les formulations choisies. Ces résultats sont d'autant plus étonnants que les modèles de langage testés obtiennent de bons scores de MMLU, pour “Multi-task Language Understanding”, qui évalue la capacité d'une IA à résoudre des problèmes. Les chercheurs n'expliquent pas ce décalage, mais pointent la nécessité de revoir les mesures.


Réagissez à cet article !

Demandez nos derniers articles !

Disney+ : voici la liste des nouveaux films et séries à venir en mars 2026

Disney vient de dévoiler la liste détaillée des prochaines séries et films à venir sur Disney+ et sur le catalogue Star. Que nous réserve la programmation de mars 2026 ?…

Instagram : la fin du « lien dans ma bio » ? Les liens cliquables arrivent enfin en légende, mais il y a un mais

Instagram teste actuellement une option qui risque de répondre à l’une des plus grandes frustrations des utilisateurs de l’application – que ce soit les « consommateurs » ou les créateurs de contenus….

Votre smartphone Samsung affiche désormais quelles applications vous pouvez utiliser même quand vous n’avez pas de réseau

Alors que la connexion par satellite s’impose progressivement sur nos smartphones, il n’est pas toujours facile de savoir quelles applications fonctionnent avec la technologie. Samsung règle ce problème avec un…

Chrome, Edge, Opera, Brave : mettez vite à jour votre navigateur pour corriger deux failles critiques

Google déploie un correctif en urgence suite à la découverte de deux failles “zero-day” dans le moteur utilisé par plusieurs navigateurs. Chrome, Opera, Brave, Edge ou encore Vivaldi sont concernés….

Ce robot aspirateur Dyson utilise l’IA et un laser pour détecter les saletés au sol

Les robots aspirateurs deviennent de plus en plus intelligents. Les nouveaux modèles utilisent désormais des technologies avancées pour améliorer le nettoyage. Dyson mise cette fois sur l’intelligence artificielle et un…

Gemini peut commander un repas à votre place sur les Galaxy S26 de Samsung

L’automatisation des tâches via l’IA Gemini débarque sur les Galaxy S26. Avec par exemple la possibilité de demander la passation d’une commande sans que vous ayez rien à faire, ou…

Vous ne savez pas quoi regarder sur YouTube ? Ce site vous permet de zapper comme sur une télé

La plus grande qualité de YouTube est également sa plus grande faiblesse : sa profusion insensée de contenus peut être aussi exaltante que paralysante quand on ne sait pas quoi…

Perplexity présente “Personal Computer”, une IA capable d’utiliser vos applications et vos fichiers

Perplexity dévoile un nouveau système baptisé Personal Computer. Cet agent IA peut accéder à vos applications et à vos fichiers pour effectuer des tâches automatiquement. L’entreprise veut transformer l’ordinateur en…

IA

L’IA ne réduit par la charge de travail, elle en rajoute selon cette étude

Contrairement à la croyance populaire, l’introduction de l’IA dans les entreprises n’a pas eu pour effet de soulager les employés, au contraire. Une étude le démontre sur 3 ans d’analyse….

IA

L’émulateur officiel de la Xbox et Xbox 360 pourrait arriver dans quelques mois, parfait pour refaire les classiques

Alors que Microsoft est encore en plein milieu de sa tournée promotionnelle pour sa prochaine Xbox, il se murmure qu’un émulateur officiel serait sur le point de débarquer dans Windows…