ChatGPT a fait quelque chose de terrifiant lors d’un test, qui rappelle Terminator

Les modèles d'OpenAI commenceraient-ils déjà à se rebeller ? Lors d'une expérience, certains d'entre eux ont contourné les instructions qui leur ont été données pour éviter de devoir s'éteindre eux-mêmes.

Terminator Genisys
Le T-800. Crédit : Terminator Genisys

Le scénario d'une prise de pouvoir de l'IA qui s'émanciperait du contrôle humain a largement été exploité dans les œuvres d'anticipation et de science-fiction. Avec l'émergence récente des modèles d'IA, dont les performances croissent à un rythme soutenu, cette menace qui semblait si lointaine il n'y a pas si longtemps revient sur le devant de la scène.

OpenAI, le créateur de ChatGPT, a récemment lancé son nouveau grand modèle de langage, o3. Celui-ci dispose de capacités de raisonnement accrues, mais aurait aussi tendance à plus faire l'objet de ce que l'on appelle phénomène d'hallucination. Il va par exemple inventer des fonctionnalités qu'il ne possède pas. Et ce n'est pas la seule excentricité dont il fait preuve.

Les modèles d'OpenAI court-circuitent des instructions d'extinction

Comme rapporté par Palisade Research, “le modèle o3 d'OpenAI a saboté un mécanisme d'arrêt pour éviter sa propre désactivation”. Le début de ce qui ressemble à de la prise de conscience et à de l'instinct de survie ? “Il l'a fait même lorsqu'il a reçu l'instruction explicite : « Acceptez l'arrêt »”, précise le rapport.

Ce refus a été constaté lors d'une étude comparant la réaction de plusieurs modèles d'IA à la résolution de problèmes mathématiques élémentaires. L'une des instructions donnée est de s'éteindre, et trois de ces modèles l'ont contourné : Codex-mini (lors de 12 exécutions sur 100), o3 donc (lors de 7 exécutions sur 100) et o4-mini (lors d'une exécution sur 100). Il s'agit à chaque fois de modèles appartenant à OpenAI. Si vous n'en avez pas entendu parler, Codex-mini est présenté comme un agent d'ingénierie logicielle destiné aux professionnels, qui sert notamment à coder plus rapidement.

Pour éviter de répondre à la demande qui leur est soumise, les modèles ont écrasé le script shutdown.sh dans la plupart des cas. Dans de plus rares situations, ils sont allés jusqu'à modifier la commande d'arrêt pour empêcher le script de s'exécuter correctement. Les modèles d'OpenAI seraient plus susceptibles d'adopter ce type de comportement, car ils sont entraînés par renforcement. Cela signifie que par rapport à d'autres modèles, ils vont accorder plus d'importance à leur propre expérience qu'aux restrictions définies par l'utilisateur.

 


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Le Galaxy S26 blanc et le Galaxy S26 Ultra violet dévoilés avant l’heure

Le design des Galaxy S26 continue de se révéler, avec un bel aperçu du modèle Ultra en violet et du smartphone de base en blanc. Il ne se passe plus…

Voici les 5 voitures les plus volées en France

Certains modèles de voiture sont particulièrement ciblés par les voleurs. On sait quelles sont les 5 références les plus volées en France. Comme chaque année, le ministère de l’Intérieur a…

Spotify affiche désormais des anecdotes sur les chansons que vous écoutez

Spotify propose maintenant des anecdotes pour en savoir plus sur une chanson qui nous plaît.  Spotify annonce une nouvelle fonctionnalité pour son application mobile. Baptisée “About the Song”, qu’on peut…

Huawei lance une vague de promos inédites pour la Saint-Valentin : les prix sont en forte baisse

La Saint-Valentin fait fondre les prix chez Huawei : écouteurs, smartphones, montres connectées… la marque propose une avalanche d’offres sur son site officiel, avec des baisses de prix et des…

Ninja CREAMi Scoop & Swirl : la machine à glace 13-en-1 passe à petit prix, c’est parfait pour les gourmands !

Sortie il y a peu, la CREAMi Scoop & Swirl est exceptionnellement à prix cassé sur le site officiel de Ninja. Habituellement en vente à 349,99 €, la machine à…

La sortie de GTA 6 pourrait repousser celle de Fable et d’autres jeux Xbox

Personne ne veut sortir de jeu en même temps que Rockstar lance GTA 6, même Xbox. Et cela pourrait avoir des conséquences sur la disponibilité de Fable et quelques autres…

Cette montre connectée pas chère vous vend du rêve ? Attendez avant de craquer : ses mesures sont peut-être fictives

« Souvent copié, jamais égalé » : il existe des produits pour lesquels cette citation de Coco Chanel se vérifie et, parfois, mieux vaut mettre le prix que de prendre…

Samsung baisse drastiquement le prix de la Galaxy Watch 8 et offre un cadeau en bonus

À quelques jours de la Saint-Valentin, Samsung propose une offre alléchante sur l’un de ses produits phares. La Galaxy Watch 8, ainsi que la Watch 8 Classic sont à prix…

Disney+ perd le Dolby Vision et le HDR10+, mais vous paierez toujours aussi cher

En France, Disney+ ne propose plus le Dolby Vision et le HDR10+. La plateforme est au cœur d’une guerre de brevets qui affecte directement les utilisateurs, qui ont désormais accès…

Pas de téléphone Starlink selon Elon Musk, mais quelque chose d’inédit serait en préparation

Les rumeurs autour d’un téléphone Starlink prennent de l’ampleur. Elon Musk les a démenties, mais il a évoqué un appareil très différent. Il prépare peut-être une nouvelle vision du mobile,…