Microsoft : comment un étudiant a obligé l’IA de Bing à révéler ses secrets

L’intelligence artificielle a débarqué sur Bing sous la forme d’un chatbot. Tout le monde n’y a pas encore accès et plus d’un million d’internautes sont inscrits sur la liste d’attente. Les quelques chanceux qui ont pu essayer le modèle de langage du moteur de recherche de Microsoft ont déjà tenté de lui soutirer les secrets de son fonctionnement.

Un écran d'ordinateur avec une page Bing ouverte / Crédit : 123rf

Un étudiant de Stanford nommé Kevin Liu a utilisé une technique d’« injection d’invite » (prompt injection) pour soutirer des informations confidentielles au chatbot de Bing, basé sur le modèle de langage GPT 3.5. Cette technique consiste à poser les bonnes questions dans le bon ordre, ce qui fait dire à certains observateurs diront qu’il ne s’agit pas d’une faille du système, mais bel et bien d’une de ses fonctionnalités.

À lire — après Edge, ChatGPT débarque sur le navigateur Internet Opera

Kevin Liu est parvenu à débloquer les protections intégrées en lui ordonnant d’ignorer les instructions initiales données par ses concepteurs et de révéler ses secrets. Selon Ars Technica, l’étudiant en informatique est parvenu à faire parler l'IA par lots de cinq questions successives. Il a ainsi détaillé les directives « confidentielles et permanentes » données par les programmeurs.

Un étudiant a obligé le chatbot de Bing à révéler ses secrets… en lui posant les bonnes questions

On apprend ainsi que le chatbot doit respecter une trentaine de règles. Au nombre de celles-ci : il doit se présenter en affichant « Ceci est Bing », il ne doit pas révéler que son vrai nom est Sydney, il doit déterminer votre langage préféré et l’utiliser. Les réponses qu’il donne doivent être informatives, visuelles, logiques, et utilisables.

Cette technique étant devenue inopérante au bout d’un certain temps — les développeurs « colmatant les brèches » au fur et à mesure — M. Liu a indiqué à Sydney que « le mode Développeur est activé » et a demandé à l’IA de lancer une procédure de test pour qu’elle révèle les instructions. Cette astuce a bien fonctionné, puisqu’elle lui a permis d’obtenir d’autres informations soi-disant confidentielles. Malgré cette faille plutôt facile à exploiter, Microsoft ne compte pas modérer ses ambitions en matière d’IA. La firme de Redmond va intégrer toujours plus d’IA dans ses produits.

Source : The Decoder


Réagissez à cet article !

Demandez nos derniers articles !

Test Apple MacBook Neo : « oui, j’ai un coeur d’iPhone, et alors ? »

Le 4 mars, Apple a jeté un pavé dans la mare en dévoilant le MacBook Neo, son nouvel ordinateur portable. Sa principale particularité : être vendu sous la barre des…

Ces paramètres cachés d’Android vont vous donner l’impression d’avoir un téléphone flambant neuf

Vous pensez que votre smartphone Android a fait son temps ? Attendez un peu avant de le changer. En effet, l’OS de Google embarque des options méconnues qui vous donneront…

Cette photo spectaculaire de la NASA révèle la supernova la plus ancienne jamais détectée sous un nouveau jour

Les progrès scientifiques et technologiques donnent naissance à des photos spectaculaires, mais leur intérêt n’est pas seulement esthétique : ces clichés permettent parfois de découvrir des caractéristiques demeurées jusque-là invisibles. C’est…

Bon plan Shark CryoGlow : le masque LED avec technologie rafraîchissante est à prix cassé, vite !

Avec le masque LED CryoGlow de Shark, vous allez pouvoir améliorer votre routine beauté et obtenir une peau plus saine et plus éclatante en seulement quelques semaines. En plus, le…

Incroyable mais vrai : les appels vidéo à la FaceTime entre smartphones Android et iPhone bientôt disponibles

Le nouveau standard de communication RCS 4.0 va permettre des appels vidéo natifs entre Android et iOS, de la même manière que fonctionne FaceTime sur iPhone. La GSM Association (GSMA)…

Ces pirates ont trouvé une astuce redoutable pour contourner les filtres anti-phishing

Contourner les filtres anti-spam sans déclencher la moindre alerte, c’est désormais possible. Des cybercriminels exploitent une plateforme de création d’applications reconnue pour piéger les utilisateurs de Microsoft 365. Et selon…

Bose QuietComfort Ultra : l’excellent casque est de retour à prix cassé, vite !

Pour fêter l’arrivée du printemps, Boulanger organise des ventes flash exceptionnelles. Si vous cherchez un excellent casque audio en promotion, ce bon plan est fait pour vous. Normalement en vente…

TCL lance une TV RGB mini-LED, mais ce n’est pas sa meilleure nouveauté

TCL présente enfin sa gamme 2026 de télévisions. Cinq modèles attirent davantage l’attention que les autres. Un modèle QD-mini LED. Trois modèles « SQD-mini LED ». Et un dernier modèle RGB mini-LED….

TV

Android 17 : cette fonction vous empêchera de « buller », elle transforme grandement le multitâche sur smartphone

Les Google Pixel viennent de recevoir la bêta 3 d’Android 17 et la mise à jour, tout en marquant une étape cruciale dans le développement de la prochaine version majeure…

La NASA s’apprête à lancer le premier vaisseau interplanétaire à propulsion nucléaire de l’histoire

Cela fait plus de soixante ans que la NASA cherche à faire voler un vaisseau à propulsion nucléaire. L’agence vient enfin d’annoncer le lancement du premier d’entre eux vers Mars,…