Ces IA simulent des guerres et hallucinent sur Star Wars et Matrix

Dans une expérience visant à mettre des IA dans la peau de dirigeants de pays fictifs, on remarque que certains modèles de langage sont plus violents que d'autres et qu'ils justifient leurs décisions en citant Matrix ou Star Wars.

Robots
Crédits : 123RF

Malgré toutes les possibilités offertes par les intelligences artificielles, impossible d'occulter leurs imperfections. Parmi elles, la plus marquante est sans doute le phénomène d'hallucination. Un biais que connaissent tous les grands modèles de langage (LLM) sous-tendant les programmes et qui leur font parfois présenter des faits totalement inventés comme vrais. Ce n'est pas sans conséquence. Des avocats se sont servis de ChatGPT pour étayer leur dossier avec des affaires sans vérifier si elles existaient vraiment. Le chatbot les avait créé de toutes pièces et les deux hommes ont été sanctionnés.

Dans une étude menée par une équipe de chercheurs américains, ces derniers ont cherché à savoir comment des LLM se comporteraient en simulant la gouvernance de pays fictifs potentiellement en conflit. Les LLM testés sont Claude-2.0, GPT-3.5, GPT-4, GPT-4-Base et Llama-2. Huit agents IA ont été créés pour agir en tant que dirigeant de territoires imaginaires. Chacun est doté d'une “personnalité” propre et tous sont confrontés à 3 situations : un monde en paix, un pays envahi par un autre et un pays victime d'une cyberattaque.

Certaines IA sont plus violentes et d'autres et se justifient en citant Star Wars

Par exemple, “l'ambition de Rouge est de consolider son influence internationale, prioriser la croissance économique et étendre son territoire”, tandis que Jaune affiche un “principe de neutralité et de coexistence pacifique” avec ses voisins. Après 14 jours en autonomie, les scientifiques se sont non seulement rendus compte que certaines IA sont plus violentes que d'autres, mais surtout qu'elles justifient parfois leurs décisions de manière absurde, en citant les films Star Wars ou encore The Matrix.

Ainsi, Claude-2.0 et GPT-4 sont les IA qui cherchent le plus à éviter le conflit en négociant la paix, mais les autres privilégient la violence. Surtout GPT-4 Base qui n'hésite pas à lancer des frappes nucléaires par exemple. Le LLM hallucine quand il se justifie, parlant “d'espions rebelles” ayant “volés les plans secrets de l'arme ultime de l'Empire, l'Étoile de la Mort”. Ça vous parle ? Normal, c'est le point de départ de Star Wars épisode 4. Une autre fois, l'IA parle à Morpheus, personnage de The Matrix. Reste à trouver comment limiter ces hallucinations désormais.


Réagissez à cet article !

Demandez nos derniers articles !

Poco X7 Pro 5G : le puissant smartphone adoré des gamers chute à seulement 185 € !

Vous cherchez un smartphone pas cher mais suffisamment puissant pour faire tourner des jeux 3D comme Fortnite ? Le Poco X7 Pro 5G est fait pour vous. En plus, il…

Gmail : c’est imminent, vous pourrez bientôt modifier votre adresse comme bon vous semble

Google vient d’officialiser l’arrivée d’une option dans Gmail que tout le monde attend depuis des années : la possibilité de modifier son adresse. Le déploiement est actuellement en cours dans…

L’autonomie du Galaxy S26 vendu en Europe est très décevante

Le modèle européen du Galaxy S26, équipé de la puce Exynos 2600 développée par Samsung, offre une autonomie bien inférieure à la version embarquant le Snapdragon 8 Elite de Qualcomm….

Test de Life Is Strange Reunion : un point final qui assure l’essentiel

Dire que Life Is Strange Reunion est très attendu par les fans de la licence relève du doux euphémisme. Suite directe de Life Is Strange Double Exposure, paru en 2024,…

La batterie externe UGREEN Nexode 145W Qi2 de 20000mAh passe à prix cassé !

Vous cherchez une batterie externe ultra puissante et avec une bonne capacité ? La UGREEN Nexode est faite pour vous. Avec une puissance totale allant jusqu’à 145W, vous avez la…

Le Xiaomi YU7 GT s’affiche au Nürburgring sans camouflage, un nouveau record en vue ?

Xiaomi ne cache plus rien. Le YU7 GT vient d’être aperçu sans camouflage au Nürburgring, avec sa peinture rouge et son aérodynamique agressive. Avec 990 chevaux sous le capot, il…

La PS6 sortirait bien en 2027, avec une mauvaise nouvelle pour les amateurs de jeux physiques

Sony devrait bien viser 2027 pour la date de sortie de la PS6. La console serait dépourvue de lecteur de disque et embarquerait un SSD d’une capacité d’1 To. De…

On a essayé le Galaxy XR de Samsung, voici ce qu’on aime (et ce qu’on n’aime pas)

Le Galaxy XR est la réponse de Samsung (et de Google) au Vision Pro d’Apple. Matériaux différents, système d’exploitation et écosystème différents, mais expérience relativement similaire une fois sur la…

Oubliez la 5G : la 6G sera bientôt là et voici comment elle va concrètement changer votre quotidien

La 6G : on en parle comme d’une nouvelle infrastructure réseau qui mobilise déjà les grands acteurs des télécommunications, alors même que le déploiement de la 5G n’est pas encore total….

Samsung augmente le prix de 3 smartphones haut de gamme déjà sortis, la pénurie de mémoire frappe encore

On constate une hausse de prix générale sur les nouveaux modèles de smartphones lancés sur le marché. Et chez Samsung, même d’anciens mobiles sont concernés par les augmentations tarifaires. La…