ChatGPT a fait quelque chose de terrifiant lors d’un test, qui rappelle Terminator

Les modèles d'OpenAI commenceraient-ils déjà à se rebeller ? Lors d'une expérience, certains d'entre eux ont contourné les instructions qui leur ont été données pour éviter de devoir s'éteindre eux-mêmes.

Terminator Genisys
Le T-800. Crédit : Terminator Genisys

Le scénario d'une prise de pouvoir de l'IA qui s'émanciperait du contrôle humain a largement été exploité dans les œuvres d'anticipation et de science-fiction. Avec l'émergence récente des modèles d'IA, dont les performances croissent à un rythme soutenu, cette menace qui semblait si lointaine il n'y a pas si longtemps revient sur le devant de la scène.

OpenAI, le créateur de ChatGPT, a récemment lancé son nouveau grand modèle de langage, o3. Celui-ci dispose de capacités de raisonnement accrues, mais aurait aussi tendance à plus faire l'objet de ce que l'on appelle phénomène d'hallucination. Il va par exemple inventer des fonctionnalités qu'il ne possède pas. Et ce n'est pas la seule excentricité dont il fait preuve.

Les modèles d'OpenAI court-circuitent des instructions d'extinction

Comme rapporté par Palisade Research, “le modèle o3 d'OpenAI a saboté un mécanisme d'arrêt pour éviter sa propre désactivation”. Le début de ce qui ressemble à de la prise de conscience et à de l'instinct de survie ? “Il l'a fait même lorsqu'il a reçu l'instruction explicite : « Acceptez l'arrêt »”, précise le rapport.

Ce refus a été constaté lors d'une étude comparant la réaction de plusieurs modèles d'IA à la résolution de problèmes mathématiques élémentaires. L'une des instructions donnée est de s'éteindre, et trois de ces modèles l'ont contourné : Codex-mini (lors de 12 exécutions sur 100), o3 donc (lors de 7 exécutions sur 100) et o4-mini (lors d'une exécution sur 100). Il s'agit à chaque fois de modèles appartenant à OpenAI. Si vous n'en avez pas entendu parler, Codex-mini est présenté comme un agent d'ingénierie logicielle destiné aux professionnels, qui sert notamment à coder plus rapidement.

Pour éviter de répondre à la demande qui leur est soumise, les modèles ont écrasé le script shutdown.sh dans la plupart des cas. Dans de plus rares situations, ils sont allés jusqu'à modifier la commande d'arrêt pour empêcher le script de s'exécuter correctement. Les modèles d'OpenAI seraient plus susceptibles d'adopter ce type de comportement, car ils sont entraînés par renforcement. Cela signifie que par rapport à d'autres modèles, ils vont accorder plus d'importance à leur propre expérience qu'aux restrictions définies par l'utilisateur.

 


Réagissez à cet article !

Demandez nos derniers articles !

Acer Swift Go 14 : avec 250 € de réduction, cet excellent PC portable avec écran OLED passe à petit prix !

Les prix continuent de chuter à l’occasion du Prime Day. Nous avons trouvé une belle offre sur le puissant Acer Swift Go 14 qui passe à 599 € au lieu…

Drone DJI Mini 3 Fly More Combo : le pack ultra complet est à -40% pour le Prime Day

Vous cherchez un petit drone pas cher mais complet qui permet de faire des vidéos et photos d’excellente qualité ? Ne cherchez plus, voici une offre immanquable sur le DJI…

Test Fiido C11 Pro : un vélo chic et abordable

Fiido est une marque asiatique désormais solidement établie en Europe et qui développe une large gamme de vélos à assistance électrique qui se caractérisent par leur excellent rapport qualité/prix. Le…

AirPods Max USB-C : près de 200 € de réduction sur l’incroyable casque d’Apple, vite !

C’est déjà le troisième (et avant-dernier) jour du Prime Day sur Amazon. Vous connaissez la musique : des prix super bas réservés aux abonnés Prime. Pour cette fois-ci, nous avons…

Quels sont les meilleurs badges télépéage ? Notre sélection des abonnements à choisir

Fulli, Ulys, ou encore Bip&Go, les solutions de télépéage permettent de gagner du temps quand on roule sur l’autoroute. L’offre est assez diversifiée, mais tous les abonnements proposés par ces…

La souris gaming Logitech G502 Hero passe est à 28 € seulement, mais il va falloir faire vite !

Les bons plans continuent sur Amazon, et c’est maintenant au tour de la souris gaming Logitech G502 Hero d’être à prix cassé. Vous pouvez ainsi l’avoir à 28,49 € alors…

Si vous recevez cet appel d’Enedis, raccrochez immédiatement

Les arnaques par téléphone se multiplient et changent sans cesse de visage. Cette fois, les escrocs empruntent l’identité d’Enedis, le gestionnaire du réseau électrique français. Leur objectif reste toujours le…

GTA 6 : date de sortie, prix, plateformes… le point sur toutes les infos

GTA 6 est sans conteste le jeu le plus attendu de la planète. Un titre dont l’ampleur est inédite dans l’histoire du jeu vidéo. Dans ce dossier, on a compilé…

Un grand fabricant lâche une mauvaise nouvelle sur les prix de la RAM, préparez-vous au pire

Les prix de la RAM s’envolent depuis des mois, portés par la demande folle de l’intelligence artificielle. Un géant des composants livre désormais ses prévisions, et elles sont mauvaises. Le…

Soldes : le puissant Lenovo IdeaPad Slim 3 avec 1To de stockage passe à moitié prix avec ce code !

Vous attendiez les Soldes pour trouver un puissant ordinateur portable à prix cassé ? Ce bon plan est fait pour vous ! Le Lenovo IdeaPad Slim 3 de 15 pouces…