Ces IA simulent des guerres et hallucinent sur Star Wars et Matrix

Dans une expérience visant à mettre des IA dans la peau de dirigeants de pays fictifs, on remarque que certains modèles de langage sont plus violents que d'autres et qu'ils justifient leurs décisions en citant Matrix ou Star Wars.

Robots
Crédits : 123RF

Malgré toutes les possibilités offertes par les intelligences artificielles, impossible d'occulter leurs imperfections. Parmi elles, la plus marquante est sans doute le phénomène d'hallucination. Un biais que connaissent tous les grands modèles de langage (LLM) sous-tendant les programmes et qui leur font parfois présenter des faits totalement inventés comme vrais. Ce n'est pas sans conséquence. Des avocats se sont servis de ChatGPT pour étayer leur dossier avec des affaires sans vérifier si elles existaient vraiment. Le chatbot les avait créé de toutes pièces et les deux hommes ont été sanctionnés.

Dans une étude menée par une équipe de chercheurs américains, ces derniers ont cherché à savoir comment des LLM se comporteraient en simulant la gouvernance de pays fictifs potentiellement en conflit. Les LLM testés sont Claude-2.0, GPT-3.5, GPT-4, GPT-4-Base et Llama-2. Huit agents IA ont été créés pour agir en tant que dirigeant de territoires imaginaires. Chacun est doté d'une “personnalité” propre et tous sont confrontés à 3 situations : un monde en paix, un pays envahi par un autre et un pays victime d'une cyberattaque.

Certaines IA sont plus violentes et d'autres et se justifient en citant Star Wars

Par exemple, “l'ambition de Rouge est de consolider son influence internationale, prioriser la croissance économique et étendre son territoire”, tandis que Jaune affiche un “principe de neutralité et de coexistence pacifique” avec ses voisins. Après 14 jours en autonomie, les scientifiques se sont non seulement rendus compte que certaines IA sont plus violentes que d'autres, mais surtout qu'elles justifient parfois leurs décisions de manière absurde, en citant les films Star Wars ou encore The Matrix.

Ainsi, Claude-2.0 et GPT-4 sont les IA qui cherchent le plus à éviter le conflit en négociant la paix, mais les autres privilégient la violence. Surtout GPT-4 Base qui n'hésite pas à lancer des frappes nucléaires par exemple. Le LLM hallucine quand il se justifie, parlant “d'espions rebelles” ayant “volés les plans secrets de l'arme ultime de l'Empire, l'Étoile de la Mort”. Ça vous parle ? Normal, c'est le point de départ de Star Wars épisode 4. Une autre fois, l'IA parle à Morpheus, personnage de The Matrix. Reste à trouver comment limiter ces hallucinations désormais.


Réagissez à cet article !

Demandez nos derniers articles !

Votre smartphone Samsung Galaxy va bientôt juger votre conduite (est-ce une si mauvaise nouvelle ?)

Basée sur Android 17, One UI 9 a déjà commencé à révéler ses premiers secrets. L’une des nouveautés qu’elle apportera sur votre smartphone Galaxy est Driving Insights : une fonction dédiée…

Certains Galaxy S27 pourraient chauffer plus que d’autres à cause d’un choix de Samsung

Samsung pourrait prendre une décision qui impacterait la chauffe globale des Galaxy S27. Tous les modèles ne seraient pas concernés, et il faudra que la marque mette en place d’autres…

« Ce n’est pas une éclipse » : un rarissime croissant de Mars immortalisé en photo par la sonde Psyche de la NASA

La mission Psyche de la NASA, alors qu’elle se dirige vers l’astéroïde du même nom, vient de capturer un phénomène rarissime. Si la photo évoque une éclipse, il n’en est…

ChatGPT n’a plus la cote : Gemini, Copilot et Claude en profitent

Les chiffres ne sont pas bons pour ChatGPT. L’IA d’OpenAI a de moins en moins d’utilisateurs alors que la concurrence gagne du terrain. Gemini titre son épingle du jeu avec…

IA

Ce data center vidait le réseau d’eau du quartier en secret pendant que les habitants étaient priés d’économiser

Aux États-Unis, des résidents ont reçu l’ordre de ne plus arroser leurs pelouses pour économiser l’eau. La vraie raison de la pénurie, ils ne la connaissaient pas encore. Un data…

IA : pourquoi une startup veut mettre des puces Nvidia dans les lampadaires

Une startup anglaise a une idée originale pour limiter l’impact environnemental des centres de données dédiés à l’intelligence artificielle. Elle repose sur l’utilisation du mobilier urbain et de l’énergie solaire….

IA

Google Home : 5 ans après le dernier Nest Hub, un nouvel écran connecté enfin en préparation ?

La refonte majeure de Google Home ne se joue pas uniquement sur le terrain logiciel avec Gemini : l’entreprise avait déjà annoncé de nouveaux produits en octobre dernier. Mais Google pourrait…

L’IA qui prend des notes pour votre médecin peut raconter n’importe quoi

En analysant 20 outils d’IA destinés à la prise de notes médicales, des chercheurs se sont rendus compte qu’ils étaient loin d’être aussi efficaces qu’ils en ont l’air. Au point…

IA

Un chercheur furieux rend publique une faille qui neutralise les protections de Windows 11

Un chercheur en sécurité mécontent vient de rendre publique une faille non corrigée dans Windows 11. Elle permet de contourner BitLocker, le système de chiffrement censé protéger les données des…

La nouvelle manette de Xbox pensée pour le cloud se dévoile en images et corrige l’un des plus défauts de ses homologues

Cette fois il semblerait que ce soit la bonne : le média Technoblog a dévoilé des photos volées de la prochaine manette Xbox pensée pour le cloud gaming. Malgré son…