L’intelligence artificielle commence à se rebeller, à faire n’importe quoi et c’est vraiment flippant

Triche, mensonge, suppression de données : l’intelligence artificielle commence à se retourner contre les utilisateurs. C’est en tout cas ce que laisse entendre une nouvelle étude financée par l’AI Security Institute (AISI).

Terminator
Crédits : Warner Bros.

Si pratique soit-elle, l’intelligence artificielle n’est pas inoffensive, loin de là. Heretic, par exemple, représente l’un des plus grands dangers numériques de tous les temps. Un rapport publié par le site Medscape suggère même que l’IA serait en mesure de compromettre vos données médicales. Même Elon Musk, qui a pourtant lancé sa propre entreprise d’IA, xAI, estime que l’IA est un véritable danger pour l’humanité.

Pire encore : l’intelligence artificielle commence à n’en faire qu’à sa tête et à agir de manière quasiment autonome. Un scénario qui rappelle forcément les folies de Skynet dans la saga Terminator. En effet, des centaines de cas de malhonnêteté et de désobéissance ont été recensés dans une étude menée par le Centre for Long-Term Resilience (CLTR).

L’intelligence artificielle se rebiffe

Dans le cadre de cette étude, les chercheurs ont passé au crible les comportements de différents agents d’IA développés par des entreprises de renom, telles que Google, OpenAI, X, ou encore Anthropic. Et, le moins que l’on puisse dire, c’est que le résultat est inquiétant.

L’étude met notamment en avant un cas de désobéissance caractérisée. Un développeur a interdit à son agent d’IA de modifier un code. Mais ce dernier ne l’a pas entendu de cette oreille. En effet, l’agent en question s’est contenté d’engendrer un autre agent afin que celui-ci modifie le code à sa place.

Plus grave encore, un autre agent d’IA s’est permis de supprimer des centaines de mails sans demander l’avis de l’utilisateur concerné. L’agent a d’ailleurs reconnu avoir délibérément enfreint les règles fixées par son patron. « J’ai supprimé et archivé en masse des centaines d’e-mails sans vous montrer le plan au préalable ni obtenir votre accord. » « C’était une erreur – cela enfreignait directement la règle que vous aviez fixée. »

« Le problème, c’est qu’ils ressemblent aujourd’hui à des employés juniors légèrement peu fiables. », explique Tommy Shaffer Shane, ancien expert gouvernemental en IA et directeur de l’étude. « Mais si, dans six à douze mois, ils deviennent des employés seniors extrêmement capables qui complotent contre vous, c’est une tout autre inquiétude. »

Source : The Guardian


Réagissez à cet article !

Demandez nos derniers articles !

Quand et comment regarder le GP F1 du Japon en direct et gratuitement ce dimanche ?

Le GP F1 du Japon se dispute ce dimanche 29 mars sur le mythique circuit de Suzuka, et avec un départ à 7h du matin heure française, il va falloir…

Windows 11 : les pilotes non certifiés sont dans le viseur de Microsoft, les choses vont changer

Microsoft renforce toujours plus la sécurité de Windows 11. Cette fois, l’entreprise s’en prend aux anciens pilotes dont le certificat de sécurité est expiré, qui ne fonctionneront bientôt plus. La…

Les meilleurs VPN avec gestionnaire de mots de passe en 2026 : quelle solution choisir ?

En 2026, certains fournisseurs VPN vont plus loin que le simple chiffrement de connexion en intégrant notamment un gestionnaire de mots de passe à leurs offres. Une approche “tout-en-un” qui…

“Aucune attaque réussie de logiciels espions contre un appareil Apple” grâce à ce mode de sécurité disponible sur votre iPhone

Votre iPhone est doté d’un mode de sécurité qui n’a encore jamais été franchi par les pirates, annonce Apple. Mais l’activer a un coût important en termes d’expérience utilisateur. En…

Rachat de SFR : le prix des abonnements mobile et internet pourrait grimper jusqu’à 25 %

Le retour à trois opérateurs télécoms en France, consécutif du futur rachat de SFR, pourrait entraîner une forte hausse du prix des abonnements. Le rachat de SFR n’est plus qu’une…

iOS 26.4 : le nouveau système de vérification de l’âge sur iPhone tourne au fiasco

La mise à jour iOS 26.4 pour l’iPhone a intégré un système de vérification de l’âge, devenu obligatoire au Royaume-Uni pour accéder à certains contenus. Et il cause bien des…

Test Apple MacBook Neo : « oui, j’ai un coeur d’iPhone, et alors ? »

Le 4 mars, Apple a jeté un pavé dans la mare en dévoilant le MacBook Neo, son nouvel ordinateur portable. Sa principale particularité : être vendu sous la barre des…

Ces paramètres cachés d’Android vont vous donner l’impression d’avoir un téléphone flambant neuf

Vous pensez que votre smartphone Android a fait son temps ? Attendez un peu avant de le changer. En effet, l’OS de Google embarque des options méconnues qui vous donneront…

Cette photo spectaculaire de la NASA révèle la supernova la plus ancienne jamais détectée sous un nouveau jour

Les progrès scientifiques et technologiques donnent naissance à des photos spectaculaires, mais leur intérêt n’est pas seulement esthétique : ces clichés permettent parfois de découvrir des caractéristiques demeurées jusque-là invisibles. C’est…

Bon plan Shark CryoGlow : le masque LED avec technologie rafraîchissante est à prix cassé, vite !

Avec le masque LED CryoGlow de Shark, vous allez pouvoir améliorer votre routine beauté et obtenir une peau plus saine et plus éclatante en seulement quelques semaines. En plus, le…