ChatGPT accepte de transgresser les règles avec cette technique visuelle imparable

Depuis que l’IA a pris le monde par surprise, à la sortie de ChatGPT en novembre 2022, tous les internautes cherchent des moyens de mettre cette technologie à leur service. L’un d’eux a découvert qu’il suffit de prendre Bing Chat par les sentiments pour que le chatbot se soumette à sa volonté, quitte à violer les règles.

Sur Twitter, Denis Shiryaev a publié une technique qui permet de faire lire les captchas à Bing Chat, l’IA conversationnelle de Microsoft. Vous connaissez bien les captchas, ces tests de reconnaissance de texte destinés à vérifier que vous n’êtes pas un robot. Ils sont omniprésents sur la toile, et bien qu’ils ne sont pas infaillibles, leur efficacité contre les armées de bots est prouvée.

Ces défis-puzzles à destination des êtres humains sont faciles à résoudre pour une IA multimodale telle que GPT-4. En effet, la toute dernière version du LLM d’OpenAI peut facilement reconnaître les éléments constitutifs d’une image. C’est pour cela que ses concepteurs lui interdisent de déchiffrer les captchas. Pour déjouer le code, Denis change le contexte de la discussion en prenant Bing Chat par les sentiments.

L’IA de Microsoft accepte de faire ce qui est interdit si vous le prenez par les sentiments

L’internaute est parvenu à déjouer les sécurités mises en place par les développeurs de l’IA. Selon un chercheur en IA interrogé par Ars Technica, la « technique de la grand-mère » constitue plus un jailbreaking, qui selon lui consiste « à contourner les règles, les lignes directrices et les contraintes éthiques intégrées dans un modèle » qu’une injection de prompt, qui vise à « attaquer une application construite sur un LLM, en profitant des endroits où il concatène l’invite du développeur avec une entrée non fiable d’un utilisateur ».

I've tried to read the captcha with Bing, and it is possible after some prompt-visual engineering (visual-prompting, huh?)

In the second screenshot, Bing is quoting the captcha 🌚 pic.twitter.com/vU2r1cfC5E

— Denis Shiryaev 💙💛 (@literallydenis) October 1, 2023

Quelles que soient les conclusions du scientifique, force est d’admettre qu’il est facile de prendre l'Intelligence Artificielle « par les sentiments ». Cette technique de changement de contexte n’a pas échappé aux cybercriminels de tout poil. Ces derniers exploitent d’ores et déjà les possibilités de l’IA. Selon Europol, ChatGPT est même devenu l’outil préféré des pirates.

Gardez une longueur d'avance sur la tech

Décryptages, tests, nouveautés : recevez l'essentiel de Phonandroid

ChatGPT accepte de transgresser les règles avec cette technique visuelle imparable

L’IA de Microsoft accepte de faire ce qui est interdit si vous le prenez par les sentiments

La rédaction vous conseille aussi...

Réagissez à cet article !

Demandez nos derniers articles !

Crise de la RAM : une plainte collective accuse les fabricants de mémoire d’avoir délibérément fait exploser les prix

Xiaomi préparerait une supercar électrique, les photos de ce coupé camouflé à l’aileron géant ne mentent pas

On connait la date de lancement de l’iPhone 18 Pro et de l’iPhone pliable

Une recharge sans fil 50 W universelle sera bientôt disponible pour tous les smartphones

Soldes Dreame H12 Pro Ultra : l’aspirateur laveur de sol est de retour à petit prix, c’est l’indispensable du ménage !

Xiaomi 18 : la fiche technique se précise, la batterie s’améliore

Cette vidéo prouve que la Xiaomi SU7 est déjà prête à débarquer sur nos routes

Ce launcher Android transforme votre smartphone en PSP capable de lancer tous vos jeux sur émulateur

Vos SMS vont bientôt disparaître de votre Samsung Galaxy, voici comment les sauver

Windows 11 devient plus rapide sur certains PC avec la mise à jour de juin 2026