ChatGPT a fait quelque chose de terrifiant lors d’un test, qui rappelle Terminator

Les modèles d'OpenAI commenceraient-ils déjà à se rebeller ? Lors d'une expérience, certains d'entre eux ont contourné les instructions qui leur ont été données pour éviter de devoir s'éteindre eux-mêmes.

Terminator Genisys
Le T-800. Crédit : Terminator Genisys

Le scénario d'une prise de pouvoir de l'IA qui s'émanciperait du contrôle humain a largement été exploité dans les œuvres d'anticipation et de science-fiction. Avec l'émergence récente des modèles d'IA, dont les performances croissent à un rythme soutenu, cette menace qui semblait si lointaine il n'y a pas si longtemps revient sur le devant de la scène.

OpenAI, le créateur de ChatGPT, a récemment lancé son nouveau grand modèle de langage, o3. Celui-ci dispose de capacités de raisonnement accrues, mais aurait aussi tendance à plus faire l'objet de ce que l'on appelle phénomène d'hallucination. Il va par exemple inventer des fonctionnalités qu'il ne possède pas. Et ce n'est pas la seule excentricité dont il fait preuve.

Les modèles d'OpenAI court-circuitent des instructions d'extinction

Comme rapporté par Palisade Research, “le modèle o3 d'OpenAI a saboté un mécanisme d'arrêt pour éviter sa propre désactivation”. Le début de ce qui ressemble à de la prise de conscience et à de l'instinct de survie ? “Il l'a fait même lorsqu'il a reçu l'instruction explicite : « Acceptez l'arrêt »”, précise le rapport.

Ce refus a été constaté lors d'une étude comparant la réaction de plusieurs modèles d'IA à la résolution de problèmes mathématiques élémentaires. L'une des instructions donnée est de s'éteindre, et trois de ces modèles l'ont contourné : Codex-mini (lors de 12 exécutions sur 100), o3 donc (lors de 7 exécutions sur 100) et o4-mini (lors d'une exécution sur 100). Il s'agit à chaque fois de modèles appartenant à OpenAI. Si vous n'en avez pas entendu parler, Codex-mini est présenté comme un agent d'ingénierie logicielle destiné aux professionnels, qui sert notamment à coder plus rapidement.

Pour éviter de répondre à la demande qui leur est soumise, les modèles ont écrasé le script shutdown.sh dans la plupart des cas. Dans de plus rares situations, ils sont allés jusqu'à modifier la commande d'arrêt pour empêcher le script de s'exécuter correctement. Les modèles d'OpenAI seraient plus susceptibles d'adopter ce type de comportement, car ils sont entraînés par renforcement. Cela signifie que par rapport à d'autres modèles, ils vont accorder plus d'importance à leur propre expérience qu'aux restrictions définies par l'utilisateur.

 


Réagissez à cet article !

Demandez nos derniers articles !

Cette éruption solaire vient de couper les communications radio et pourrait offrir des aurores boréales

Le Soleil vient de lâcher une puissante éruption, accompagnée d’un nuage de plasma en route vers la Terre. Le choc pourrait survenir dès cette nuit. Des aurores boréales sont attendues…

Quelle est votre première chanson et votre artiste le plus écouté sur Spotify ? Voici comment le savoir

Pour célébrer ses 20 ans, Spotify lance un outil de type Wrapped, mais qui fait le bilan de votre présence sur la plateforme depuis vos débuts plutôt que de la…

Dreamina AI : la génération de vidéos ultra-réalistes est restreinte en France, voici pourquoi et comment la débloquer

ByteDance propose l’un des générateurs vidéo IA les plus impressionnants du moment, mais l’accès est volontairement bridé en France et dans l’UE. Voici comment en profiter plus confortablement pour en…

Free active l’option eSIM pour les Samsung Galaxy Watch, et c’est gratuit !

Les abonnés Free Mobile peuvent désormais accéder gratuitement à l’eSIM sur leur montre connectée Samsung Galaxy Watch. Les Google Pixel Watch seront bientôt prises en charge également. En décembre dernier,…

One UI 9 : la bêta est enfin ouverte au public, votre smartphone est-il éligible ?

Quelques heures après que la rumeur s’est diffusée dans le monde entier, Samsung a fini par lâcher le morceau : la première bêta publique de One UI 9 sera disponible…

JBL rend officielle la série JBL Live 4 : des écouteurs conçus pour une expérience complète et sur mesure encore plus fluide

JBL a officialisé sa nouvelle série d’écouteurs avec boîtier Smart Charging Case : la gamme JBL Live 4. Caractéristiques principales, prix, nouveautés… Voici ce qu’il faut retenir des trois modèles qui…

Les JBL Live 680NC et 780NC sont officiels : ces casques pensés pour le quotidien allient style, confort et qualité audio

JBL officialise sa nouvelle gamme de casques Live : les JBL Live 680NC et 780NC. La marque a fait évoluer plusieurs aspects afin de proposer des produits pensés pour le quotidien,…

JBL officialise le EasySing Mic Mini : faites entendre votre voix partout grâce à ce micro nomade dopé à l’IA

JBL vient de présenter plusieurs produits. Aux côtés des nouvelles générations de casques, écouteurs et PartyBox, un appareil fait figure de nouveauté totale : le EasySing Mic Mini, un micro de…

JBL officialise les enceintes PartyBox 130 et 330 ou comment faire la fête intensément jusqu’au bout de la nuit

En même temps que ses nouvelles séries de casques, d’écouteurs et d’un produit inédit, JBL vient d’officialiser la dernière génération de ses enceintes festives, composée des PartyBox 130 et PartyBox…

Voiture électrique : Lexus rattrape enfin Tesla en ajoutant cette option fondamentale

Il était temps que les voitures électriques Lexus se mettent au niveau de la concurrence. Surtout au niveau d’une fonction très utilisée ailleurs depuis des années et totalement absente des…