ChatGPT a fait quelque chose de terrifiant lors d’un test, qui rappelle Terminator

Les modèles d'OpenAI commenceraient-ils déjà à se rebeller ? Lors d'une expérience, certains d'entre eux ont contourné les instructions qui leur ont été données pour éviter de devoir s'éteindre eux-mêmes.

Terminator Genisys
Le T-800. Crédit : Terminator Genisys

Le scénario d'une prise de pouvoir de l'IA qui s'émanciperait du contrôle humain a largement été exploité dans les œuvres d'anticipation et de science-fiction. Avec l'émergence récente des modèles d'IA, dont les performances croissent à un rythme soutenu, cette menace qui semblait si lointaine il n'y a pas si longtemps revient sur le devant de la scène.

OpenAI, le créateur de ChatGPT, a récemment lancé son nouveau grand modèle de langage, o3. Celui-ci dispose de capacités de raisonnement accrues, mais aurait aussi tendance à plus faire l'objet de ce que l'on appelle phénomène d'hallucination. Il va par exemple inventer des fonctionnalités qu'il ne possède pas. Et ce n'est pas la seule excentricité dont il fait preuve.

Les modèles d'OpenAI court-circuitent des instructions d'extinction

Comme rapporté par Palisade Research, “le modèle o3 d'OpenAI a saboté un mécanisme d'arrêt pour éviter sa propre désactivation”. Le début de ce qui ressemble à de la prise de conscience et à de l'instinct de survie ? “Il l'a fait même lorsqu'il a reçu l'instruction explicite : « Acceptez l'arrêt »”, précise le rapport.

Ce refus a été constaté lors d'une étude comparant la réaction de plusieurs modèles d'IA à la résolution de problèmes mathématiques élémentaires. L'une des instructions donnée est de s'éteindre, et trois de ces modèles l'ont contourné : Codex-mini (lors de 12 exécutions sur 100), o3 donc (lors de 7 exécutions sur 100) et o4-mini (lors d'une exécution sur 100). Il s'agit à chaque fois de modèles appartenant à OpenAI. Si vous n'en avez pas entendu parler, Codex-mini est présenté comme un agent d'ingénierie logicielle destiné aux professionnels, qui sert notamment à coder plus rapidement.

Pour éviter de répondre à la demande qui leur est soumise, les modèles ont écrasé le script shutdown.sh dans la plupart des cas. Dans de plus rares situations, ils sont allés jusqu'à modifier la commande d'arrêt pour empêcher le script de s'exécuter correctement. Les modèles d'OpenAI seraient plus susceptibles d'adopter ce type de comportement, car ils sont entraînés par renforcement. Cela signifie que par rapport à d'autres modèles, ils vont accorder plus d'importance à leur propre expérience qu'aux restrictions définies par l'utilisateur.

 


Réagissez à cet article !

Demandez nos derniers articles !

Google améliore enfin le Fitbit Air, les choses vont changer

Le bracelet connecté de Google, le Fitbit Air, s’améliore. La firme de Mountain View est en effet en train de déployer un important correctif, qui devrait largement améliorer l’expérience des…

Démarchage téléphonique : le Conseil constitutionnel censure la loi, voici ce qui va changer

Véritable fléau des temps modernes, le démarchage téléphonique pourrait bientôt revenir en masse. Suite à une action en justice d’Orange, le Conseil constitutionnel a en effet censuré plusieurs dispositions d’une…

Test Fiido T2 : Le vélo pour toute la famille sans se ruiner

Le constructeur Fiido ne pouvait passer à côté du segment des longtails, des vélos à assistance électrique pensés pour transporter confortablement et en toute sécurité les enfants. Voici le nouveau…

C’est la fin pour Aibo : Sony enterre son chien-robot emblématique

Le chien-robot ERS-1000 Aibo de Sony, c’est bientôt terminé. Le fabricant a en effet annoncé son intention de cesser de vendre l’adorable compagnon robotique dans son pays d’origine, le Japon….

PS6 portable : Sony lâche un énorme indice, elle pourrait débarquer plus tôt que prévu

Après la PS5 Pro, une PlayStation 6 portable pourrait bien devenir réalité. C’est en tout cas ce que semble suggérer le patron de Sony Interactive Entertainment, Hideaki Nishino, au cours…

La crise de la RAM menace l’iPhone 18, Apple pourrait sacrifier une partie d’iOS 27

La crise de la RAM pourrait faire une victime de plus. À cause de celle-ci, l’iPhone 18 d’Apple pourrait ainsi être privé de certaines fonctionnalités offertes par iOS 27. L’actuelle…

GTA 6 sur Switch 2 ? Rockstar prépare une énorme surprise, vous n’êtes pas prêts

Initialement disponible sur PS5 et Xbox Series X/S, le futur banger de Rockstar pourrait bien débarquer sur la console portable de Nintendo. Un leaker affirme en effet que GTA 6…

Appels indésirables incessants : cette solution efficace est proposée par NordVPN !

Tout le monde connaît NordVPN, le service VPN le plus avancé et le plus complet du marché. Mais cette solution pour sécuriser votre vie en ligne vient de dévoiler un…

Combien d’emplois ont été perdus à cause de l’IA ? Cet outil nous donne la réponse

Face aux inquiétudes concernant les conséquences de l’IA sur le marché du travail, la Californie a mis en ligne un outil de suivi des pertes d’emploi directement liées à cette…

The Frame 4K QLED (2026) de 55 pouces : à peine sortie, Samsung brade déjà son excellente TV pour les Soldes !

Les Soldes ont commencé sur Samsung et cette année encore, le géant coréen ne fait pas les choses à moitié. Sortie récemment, la nouvelle The Frame 4K QLED de 55…