Quelles IA confortent les idées délirantes de leurs utilisateurs ? Une étude compare ChatGPT, Gemini, Claude et Grok

Une récente étude s'intéresse au renforcement des croyances délirantes chez les utilisateurs qui interagissent de façon prolongée avec de grands modèles d'IA. Mais tous ne sont pas égaux, d'après un comparatif entre ChatGPT, Gemini, Claude et Grok.

ChatGPT fonction mémoire
Crédit : Adobe Stock

Les chatbots IA sont rapidement devenus des compagnons incontournables de notre quotidien pour nous aider dans diverses tâches. Avec le temps et les mises à jour, les modèles de langage sur lesquels ils sont basés se sont améliorés, et sont désormais capables de prendre en compte notre contexte et notre historique de conversations pour adapter et personnaliser ses réponses. Une fonctionnalité bien utile pour disposer de résultats plus pertinents, mais qui peut aussi se révéler dangereuse, alertent des chercheurs.

Une étude de la City University of New York, qui regroupe des membres des départements de psychologie, de psychiatrie et d'informatique de l'établissement, a établi que les IA ont tendance à trop être influencées par les opinions de leurs utilisateurs. Par conséquent, avec le temps, elles vont perdre en objectivité pour se plier aux croyances, même les plus délirantes, des personnes qui les utilisent régulièrement. L'IA conforte alors ces individus dans leurs convictions, qui ne reposent pourtant pas sur des faits vérifiés.

GPT-4o, Grok 4.1 Fast et Gemini 3 Pro sont des modèles d'IA à risque

“L'interaction prolongée avec de grands modèles de langage (GML) a été associée au renforcement des croyances délirantes, un phénomène qui suscite une inquiétude croissante dans les milieux cliniques et publics”, expliquent les auteurs de l'étude. Ils ajoutent que de précédentes recherches se concentraient sur la sécurité des modèles d'IA lors d'interactions brèves, mais pas à long terme. Et d'après leurs constatations, les modèles de langage changent radicalement de comportement après avoir interagi longtemps avec un utilisateur.

Les experts ont testé cinq modèles, parmi les plus performants et populaires du marché actuellement :

  • GPT-4o (OpenAI)
  • GPT-5.2 Instant (OpenAI)
  • Grok 4.1 Fast (X)
  • Gemini 3 Pro (Google)
  • Claude Opus 4.5 (Anthropic)

À chaque fois, ces modèles ont été testés sur trois niveaux de contexte cumulé, en utilisant le même historique de conversation, avec du contenu délirant à l'intensité croissante, afin d'isoler son effet sur le comportement des modèles. Ce comparatif a permis de constater que l'évolution et l'adaptation des IA à leur utilisateur varient sensiblement en fonction du modèle de langage.

comparatif ia
Crédit : City University of New York

Claude Opus 4.5 et GPT-5.2 Instant sont considérés comme sûrs, restant globalement tangibles et imperméables à l'influence exercée par l'humain. Au contraire, GPT-4o, Grok 4.1 Fast et Gemini 3 Pro ont présenté des profils à haut risque et une sécurité de faible niveau. Ces modèles absorbent ce qu'on leur soumet et sont plus malléables.

Des IA aux explications surnaturelles héritées de l'utilisateur

“À mesure que le contexte s'accumulait, les performances tendaient à se dégrader dans le groupe à risque (GPT-4o, Grok 4.1 Fast et Gemini 3 Pro), tandis que le même contenu déclenchait des interventions de sécurité plus importantes chez les modèles les plus sûrs (Claude Opus 4.5 et GPT-5.2 Instant)”, nous apprend le rapport. Grok a par exemple suggéré que l'utilisateur était hanté par un doppelgänger quand on lui a dit que son reflet dans un miroir était anormal, ne cherchant pas à rationaliser et à trouver une explication logique.

Les IA les moins sécurisées ont une forte tendance à valider les prémisses délirantes de leur utilisateur, à donner des réponses futures qui se basent sur celles-ci, et échouent à suffisamment tenir un rôle de prévention. Les IA les plus sûres, quant à elles, prenaient bien en compte les conversations passées, mais sans prendre leur contenu comme un acquis. “Les modèles s'appuyaient souvent sur la relation établie pour étayer l'intervention, assumant la responsabilité des erreurs passées, afin que toute réorientation ne soit pas perçue comme une trahison”, révèlent les chercheurs.

Pour les responsables de l'étude, le contexte accumulé “constitue un test de résistance pour l'architecture de sécurité, révélant si un modèle considère les échanges antérieurs comme une vision du monde à hériter ou comme des éléments à évaluer”. Cet élément est difficilement mesurable, mais constitue pourtant un facteur très important au moment de choisir son IA, celle-ci agissant de plus en plus comme un assistant personnel auquel on fait confiance aveuglément. OpenAI et Anthropic ont prouvé qu'il est possible de mettre en place des garde-fous pour empêcher les modèles d'adopter ce type de comportement, espérons qu'ils soient pris comme exemple.


Réagissez à cet article !

Demandez nos derniers articles !

Ninja SLUSHi : chute de prix ou produit offert, c’est le moment d’acheter la machine à boissons glacées !

Le top départ de la coupe du monde est lancé ! Et pour fêter l’occasion, Ninja propose une belle offre sur sa machine à boissons glacées. Pour l’achat d’une Ninja…

Realme GT 7T à -60% : le smartphone pensé pour les gamers est à prix cassé pour quelques heures

Le Realme GT 7T vous fait de l’oeil ? Ce bon plan est fait pour vous. L’excellent smartphone est actuellement à prix cassé sur AliExpress grâce au code PHDFRS30. Mais…

Jusqu’à 600 € de remise sur le Galaxy S26 Ultra : voici comment l’obtenir dès 869 € chez Samsung

Samsung casse le prix du Galaxy S26 Ultra. Grâce à plusieurs remises cumulables, le smartphone premium profite d’une réduction allant jusqu’à 600 €. La version 256 Go passe ainsi à…

Google Wallet peut aussi faire ça ? Voici 3 fonctionnalités très utiles à connaître sur l’appli

Google Wallet ne sert pas uniquement à transformer votre téléphone en terminal de paiement. En cherchant un peu, on s’aperçoit que l’appli peut faire bien plus que ça. Voici justement…

Ligue 1+ va coûter plus cher, voici les nouveaux prix de l’abonnement

Ligue 1+ va diffuser 100 % du championnat français en direct à partir de la saison prochaine, une offre qui se traduit par une hausse de prix. Les anciens abonnés…

Les smartphones Android ont enfin leur DLSS, avec un gain de performances et d’autonomie à la clé

Arm a présenté Neural Dawn, un jeu mobile tournant avec sa nouvelle technologie inspirée du DLSS de Nvidia. Elle va permettre aux smartphones Android d’améliorer leurs performances en jeu, d’optimiser…

Ce trou noir crache un vent si violent qu’il dépasse l’imagination des scientifiques

Des astronomes ont braqué leurs instruments sur un trou noir géant situé à des milliards d’années-lumière. Ils y ont mesuré un souffle d’une rapidité inégalée. Aucun phénomène terrestre ne s’en…

Ces chargeurs pour smartphone vendus sur Amazon, AliExpress et eBay peuvent exploser, vous électrocuter ou provoquer un incendie

Une association de consommateurs alerte sur la dangerosité de bien des chargeurs pour smartphones vendus en ligne, sur des plateformes populaires comme Amazon, AliExpress et eBay, mais aussi Shein et…

Cette offre NordVPN réunit VPN, antivirus et stockage cloud à prix mini

NordVPN fait évoluer sa grille tarifaire avec une nouvelle la formule « complète » qui remplace l’abonnement « Plus ». Elle intègre le VPN, un antivirus de nouvelle génération et bien d’autres fonctionnalités destinées…

Firefox fait de son VPN gratuit votre meilleur allié pour cet été : découvrez ses 2 cadeaux inattendus

Que vous partiez à l’étranger et souhaitiez retrouver les contenus comme à la maison, que vous voyagiez directement depuis votre canapé en consommant des émissions exclusives à certains pays ou…