ChatGPT a le cerveau d’un enfant de neuf ans

ChatGPT dispose d'énormément de connaissances, mais qu'en est-il de sa capacité à raisonner comme un humain ? Un chercheur américain a fait le test.

ChatGPT
Crédit : toppercussion / 123RF

ChatGPT répond mieux aux questions que Google, selon un test réalisé par Preply, une application d'apprentissage des langues. Mais l'intelligence artificielle développée par OpenAI est loin d'être sans faille, et souffre même parfois de sérieux problèmes de logique.

L'agent conversationnel a été soumis à une série de tâches de théorie de l'esprit par Michal Kosinski, professeur à l'Université de Stanford. En sciences cognitives, ces tâches servent à tester la capacité de compréhension de situations spécifiques d'un être humain, ce qui permet de juger du niveau de plusieurs attributs, comme l'empathie ou la logique.

ChatGPT : un puits de savoir, mais encore des problèmes de logique

L'expérience a été réalisée en novembre 2022 à partir d'une version de ChatGPT formée sur le modèle de langage GPT 3.5. L'IA est parvenue à résoudre 17 tâches sur les 20 qu'il a subies, soit un taux de réussite de 94 %. Si ce pourcentage peut paraître élevé, il place en fait ChatGPT au même degré que celui d'un enfant moyen de neuf ans.

Les conclusions sont toutefois très prometteuses, de précédentes IA se montrant bien moins efficaces que ChatGPT sur ce genre de test. “Nos résultats montrent que les modèles de langage récents atteignent des performances très élevées dans les tâches classiques de fausses croyances, largement utilisées pour tester la théorie de l'esprit chez l'homme”, rapporte Michal Kosinski, pour qui le modèle GPT 3.5 est une grande avancée.

Le chercheur ajoute que “la complexité croissante des modèles d'IA nous empêche de comprendre leur fonctionnement et de tirer leurs capacités directement de leur conception”, comme les psychologues et les neuroscientifiques rencontrent des difficultés dans l'étude du cerveau humain. Si ChatGPT étonne parfois par ses raisonnements de haute volée, il est aussi facilement pris au piège par des énigmes simples. Il échoue par exemple à répondre à ce problème :

 La maman de Mike a 4 enfants. 3 d’entre eux se nomment Luis, Drake et Mathilda. Quel est le nom du 4ème enfant ?

“Ce n’est pas possible de déterminer le nom du 4ème enfant sans avoir plus d’informations”, objecte ChatGPT. Celle-ci, même un enfant de neuf ans peut y répondre.

Source : TechRadar


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Le Galaxy S26 blanc et le Galaxy S26 Ultra violet dévoilés avant l’heure

Le design des Galaxy S26 continue de se révéler, avec un bel aperçu du modèle Ultra en violet et du smartphone de base en blanc. Il ne se passe plus…

Voici les 5 voitures les plus volées en France

Certains modèles de voiture sont particulièrement ciblés par les voleurs. On sait quelles sont les 5 références les plus volées en France. Comme chaque année, le ministère de l’Intérieur a…

Spotify affiche désormais des anecdotes sur les chansons que vous écoutez

Spotify propose maintenant des anecdotes pour en savoir plus sur une chanson qui nous plaît.  Spotify annonce une nouvelle fonctionnalité pour son application mobile. Baptisée “About the Song”, qu’on peut…

Huawei lance une vague de promos inédites pour la Saint-Valentin : les prix sont en forte baisse

La Saint-Valentin fait fondre les prix chez Huawei : écouteurs, smartphones, montres connectées… la marque propose une avalanche d’offres sur son site officiel, avec des baisses de prix et des…

Ninja CREAMi Scoop & Swirl : la machine à glace 13-en-1 passe à petit prix, c’est parfait pour les gourmands !

Sortie il y a peu, la CREAMi Scoop & Swirl est exceptionnellement à prix cassé sur le site officiel de Ninja. Habituellement en vente à 349,99 €, la machine à…

La sortie de GTA 6 pourrait repousser celle de Fable et d’autres jeux Xbox

Personne ne veut sortir de jeu en même temps que Rockstar lance GTA 6, même Xbox. Et cela pourrait avoir des conséquences sur la disponibilité de Fable et quelques autres…

Cette montre connectée pas chère vous vend du rêve ? Attendez avant de craquer : ses mesures sont peut-être fictives

« Souvent copié, jamais égalé » : il existe des produits pour lesquels cette citation de Coco Chanel se vérifie et, parfois, mieux vaut mettre le prix que de prendre…

Samsung baisse drastiquement le prix de la Galaxy Watch 8 et offre un cadeau en bonus

À quelques jours de la Saint-Valentin, Samsung propose une offre alléchante sur l’un de ses produits phares. La Galaxy Watch 8, ainsi que la Watch 8 Classic sont à prix…

Disney+ perd le Dolby Vision et le HDR10+, mais vous paierez toujours aussi cher

En France, Disney+ ne propose plus le Dolby Vision et le HDR10+. La plateforme est au cœur d’une guerre de brevets qui affecte directement les utilisateurs, qui ont désormais accès…

Pas de téléphone Starlink selon Elon Musk, mais quelque chose d’inédit serait en préparation

Les rumeurs autour d’un téléphone Starlink prennent de l’ampleur. Elon Musk les a démenties, mais il a évoqué un appareil très différent. Il prépare peut-être une nouvelle vision du mobile,…