ChatGPT a le cerveau d’un enfant de neuf ans

ChatGPT dispose d'énormément de connaissances, mais qu'en est-il de sa capacité à raisonner comme un humain ? Un chercheur américain a fait le test.

ChatGPT
Crédit : toppercussion / 123RF

ChatGPT répond mieux aux questions que Google, selon un test réalisé par Preply, une application d'apprentissage des langues. Mais l'intelligence artificielle développée par OpenAI est loin d'être sans faille, et souffre même parfois de sérieux problèmes de logique.

L'agent conversationnel a été soumis à une série de tâches de théorie de l'esprit par Michal Kosinski, professeur à l'Université de Stanford. En sciences cognitives, ces tâches servent à tester la capacité de compréhension de situations spécifiques d'un être humain, ce qui permet de juger du niveau de plusieurs attributs, comme l'empathie ou la logique.

ChatGPT : un puits de savoir, mais encore des problèmes de logique

L'expérience a été réalisée en novembre 2022 à partir d'une version de ChatGPT formée sur le modèle de langage GPT 3.5. L'IA est parvenue à résoudre 17 tâches sur les 20 qu'il a subies, soit un taux de réussite de 94 %. Si ce pourcentage peut paraître élevé, il place en fait ChatGPT au même degré que celui d'un enfant moyen de neuf ans.

Les conclusions sont toutefois très prometteuses, de précédentes IA se montrant bien moins efficaces que ChatGPT sur ce genre de test. “Nos résultats montrent que les modèles de langage récents atteignent des performances très élevées dans les tâches classiques de fausses croyances, largement utilisées pour tester la théorie de l'esprit chez l'homme”, rapporte Michal Kosinski, pour qui le modèle GPT 3.5 est une grande avancée.

Le chercheur ajoute que “la complexité croissante des modèles d'IA nous empêche de comprendre leur fonctionnement et de tirer leurs capacités directement de leur conception”, comme les psychologues et les neuroscientifiques rencontrent des difficultés dans l'étude du cerveau humain. Si ChatGPT étonne parfois par ses raisonnements de haute volée, il est aussi facilement pris au piège par des énigmes simples. Il échoue par exemple à répondre à ce problème :

 La maman de Mike a 4 enfants. 3 d’entre eux se nomment Luis, Drake et Mathilda. Quel est le nom du 4ème enfant ?

“Ce n’est pas possible de déterminer le nom du 4ème enfant sans avoir plus d’informations”, objecte ChatGPT. Celle-ci, même un enfant de neuf ans peut y répondre.

Source : TechRadar


Réagissez à cet article !

Demandez nos derniers articles !

Windows 11 : le retour de cette option de la barre des tâches va ravir les nostalgiques (mais pas que…)

Plus de cinq ans auparavant, les utilisateurs de Windows avaient la possibilité de déplacer la barre des tâches sur le côté, à la verticale, une fonctionnalité qui a depuis disparu….

Malgré l’échec du Fire Phone, Amazon s’entête et prépare un smartphone dopé à l’IA

L’échec rencontré par le premier smartphone d’Amazon, le Fire Phone, semble avoir refroidi l’entreprise pendant plusieurs années. Mais Amazon serait en train de revenir à la charge, avec un nouveau…

Firefly : le reboot de la série culte se précise, un nouvel acteur au programme

Série culte des années 2000, Firefly va bientôt avoir droit à un reboot sous la forme d’un anime. Et, si la plupart des membres du casting originel prêteront leurs voix…

AliExpress casse les prix pour son anniversaire : voici les offres qui valent le coup

Pour célébrer son anniversaire, AliExpress lance une vague de promotions sur l’ensemble de son site, et notamment sur nombreux produits high-tech. Smartphones, tablettes, PC, casques et écouteurs, objets connectés : pendant…

30% de réduction sur le Sony WH-1000XM6 : enfin une vraie baisse de prix sur le casque premium

Le Sony WH-1000XM6 est l’un des casques sans fil les plus aboutis disponibles aujourd’hui, si ce n’est le meilleur. Il fait aujourd’hui l’objet d’une réduction de 140 €. Profiter de…

En promo à moins de 225 €, le Redmi Note 14 Pro+ est ultra performant pour son prix

Le Redmi Note 14 Pro+ voit son prix chuter de plus de 50% et passe sous la barre des 225 €. À prix-là, c’est un milieu de gamme très performant,…

Mais à quoi joue Google ? Son IA modifie les titres d’articles dans la recherche web, et ils sont loin d’être pertinents

La recherche web Google modifie automatiquement par IA les titres d’articles affichés comme résultats pour les simplifier. Quitte à dénaturer totalement leur propos. On s’en aperçoit tous les jours, la…

IA

La dernière mise à jour SteamOS prépare le terrain pour la Steam Machine

Valve a déployé une mise à jour pour passer à la version 3.8.0 de SteamOS. Celle-ci apporte de nombreuses nouveautés, dont la préparation à la compatibilité de la Steam Machine….

Samsung fait chuter le prix des Galaxy Buds 4 et Buds 4 Pro : à peine sortis, et déjà en promo

Les Galaxy Buds4 et Buds 4 Pro sont déjà beaucoup moins chers grâce à l’offre de lancement de Samsung, disponible pour une durée limitée. Une excellente occasion pour s’offrir les…

Les meilleurs VPN pour voyager en 2026 : comparatif, conseils et critères essentiels

Voyager en 2026, c’est aussi protéger sa vie numérique. Entre Wi-Fi publics, restrictions géographiques et accès aux services français depuis l’étranger, choisir le bon VPN devient un réflexe essentiel pour…