Ces IA simulent des guerres et hallucinent sur Star Wars et Matrix

Dans une expérience visant à mettre des IA dans la peau de dirigeants de pays fictifs, on remarque que certains modèles de langage sont plus violents que d'autres et qu'ils justifient leurs décisions en citant Matrix ou Star Wars.

Robots
Crédits : 123RF

Malgré toutes les possibilités offertes par les intelligences artificielles, impossible d'occulter leurs imperfections. Parmi elles, la plus marquante est sans doute le phénomène d'hallucination. Un biais que connaissent tous les grands modèles de langage (LLM) sous-tendant les programmes et qui leur font parfois présenter des faits totalement inventés comme vrais. Ce n'est pas sans conséquence. Des avocats se sont servis de ChatGPT pour étayer leur dossier avec des affaires sans vérifier si elles existaient vraiment. Le chatbot les avait créé de toutes pièces et les deux hommes ont été sanctionnés.

Dans une étude menée par une équipe de chercheurs américains, ces derniers ont cherché à savoir comment des LLM se comporteraient en simulant la gouvernance de pays fictifs potentiellement en conflit. Les LLM testés sont Claude-2.0, GPT-3.5, GPT-4, GPT-4-Base et Llama-2. Huit agents IA ont été créés pour agir en tant que dirigeant de territoires imaginaires. Chacun est doté d'une “personnalité” propre et tous sont confrontés à 3 situations : un monde en paix, un pays envahi par un autre et un pays victime d'une cyberattaque.

Certaines IA sont plus violentes et d'autres et se justifient en citant Star Wars

Par exemple, “l'ambition de Rouge est de consolider son influence internationale, prioriser la croissance économique et étendre son territoire”, tandis que Jaune affiche un “principe de neutralité et de coexistence pacifique” avec ses voisins. Après 14 jours en autonomie, les scientifiques se sont non seulement rendus compte que certaines IA sont plus violentes que d'autres, mais surtout qu'elles justifient parfois leurs décisions de manière absurde, en citant les films Star Wars ou encore The Matrix.

Ainsi, Claude-2.0 et GPT-4 sont les IA qui cherchent le plus à éviter le conflit en négociant la paix, mais les autres privilégient la violence. Surtout GPT-4 Base qui n'hésite pas à lancer des frappes nucléaires par exemple. Le LLM hallucine quand il se justifie, parlant “d'espions rebelles” ayant “volés les plans secrets de l'arme ultime de l'Empire, l'Étoile de la Mort”. Ça vous parle ? Normal, c'est le point de départ de Star Wars épisode 4. Une autre fois, l'IA parle à Morpheus, personnage de The Matrix. Reste à trouver comment limiter ces hallucinations désormais.


Réagissez à cet article !

Demandez nos derniers articles !

Instagram : les messages chiffrés de bout en bout seront très bientôt de l’histoire ancienne, voici pourquoi

Le système de chiffrement de bout en bout renforce la sécurité et la protection des messages privés. Plusieurs messageries instantanées en bénéficient et parmi elles figurent notamment trois des applications…

Le CMF Phone 2 Pro passe à 179 € : un rapport qualité-prix imbattable

Si vous avez moins de 200 € pour un smartphone, le CMF Phone 2 Pro est l’un des meilleurs choix disponibles en ce moment. Lancé à 259 €, ce smartphone…

Le cerveau d’une mouche a-t-il vraiment été transféré dans un ordinateur ? La réalité est bien plus complexe

Depuis la semaine dernière, une équipe de chercheurs affirme avoir “uploadé” l’esprit d’une mouche dans un ordinateur. S’en est suivi une cascade de réactions à la fois apeurées et enthousiastes….

IA

Marvel sur Disney+ : dans quel ordre chronologique doit-on regarder les films ?

Si vous comptez vous abonner à la plateforme Disney+ pour voir ou revoir les aventures des héros issus de l’univers Marvel, vous devez d’abord vous poser ces 2 questions :…

Sony, Bose, JBL : ces ventes flash Boulanger font chuter les prix du son, mais il faut faire vite !

Boulanger lance une vague de promotions dans la catégorie son, pour une durée limitée. Ce lundi 16 mars 2026, des casques, écouteurs, enceintes Bluetooth et barres de son haut de…

Bientôt un nouveau Mario 3D sur la Switch 2 ? Les joueurs sont à la recherche du moindre indice

Les rumeurs s’intensifient sur la supposée sortie d’un nouveau Mario 3D cette année… au point de s’appuyer sur des bribes d’indices. Ainsi, lorsque l’on demande au leaker réputé NateTheHate s’il…

Windows 11 : impossible d’accéder au disque C: sur certains PC après la dernière mise à jour, la tuile !

Tous les bugs de Windows 11 ne sont pas aussi graves les uns que les autres, mais celui que subit aujourd’hui une partie des utilisateurs est particulièrement handicapant. Depuis la…

Microsoft change ses plans et retire certaines fonctions Copilot de Windows 11

Microsoft multiplie les fonctions liées à l’intelligence artificielle dans Windows 11. Cette stratégie ne fait pourtant pas l’unanimité chez les utilisateurs. Face aux critiques, certains projets pourraient finalement disparaître. Depuis…

La Xbox One a enfin été jailbreakée, 13 ans après sa sortie

Il y a des jailbreaks qui sont plus attendus par la communauté que d’autres, et celui de la Xbox One n’en fait partie. C’est pourtant le projet dans lequel s’est…

Spotify : les recommandations deviennent encore plus personnalisables avec cette nouveauté

Spotify lance une nouvelle fonctionnalité permettant de personnaliser son “Taste Profil”. Objectif : mieux affiner les recommandations de l’application. Voici comment cela fonctionne. L’une des grandes forces d’un service de…