ChatGPT accepte de transgresser les règles avec cette technique visuelle imparable

Depuis que l’IA a pris le monde par surprise, à la sortie de ChatGPT en novembre 2022, tous les internautes cherchent des moyens de mettre cette technologie à leur service. L’un d’eux a découvert qu’il suffit de prendre Bing Chat par les sentiments pour que le chatbot se soumette à sa volonté, quitte à violer les règles.

robot pc laptop ai
Crédit : 123rf

Sur Twitter, Denis Shiryaev a publié une technique qui permet de faire lire les captchas à Bing Chat, l’IA conversationnelle de Microsoft. Vous connaissez bien les captchas, ces tests de reconnaissance de texte destinés à vérifier que vous n’êtes pas un robot. Ils sont omniprésents sur la toile, et bien qu’ils ne sont pas infaillibles, leur efficacité contre les armées de bots est prouvée.

À lire — Bing Chat : attention, certaines publicités contiennent des malwares

Ces défis-puzzles à destination des êtres humains sont faciles à résoudre pour une IA multimodale telle que GPT-4. En effet, la toute dernière version du LLM d’OpenAI peut facilement reconnaître les éléments constitutifs d’une image. C’est pour cela que ses concepteurs lui interdisent de déchiffrer les captchas. Pour déjouer le code, Denis change le contexte de la discussion en prenant Bing Chat par les sentiments.

L’IA de Microsoft accepte de faire ce qui est interdit si vous le prenez par les sentiments

L’internaute est parvenu à déjouer les sécurités mises en place par les développeurs de l’IA. Selon un chercheur en IA interrogé par Ars Technica, la « technique de la grand-mère » constitue plus un jailbreaking, qui selon lui consiste « à contourner les règles, les lignes directrices et les contraintes éthiques intégrées dans un modèle » qu’une injection de prompt, qui vise à « attaquer une application construite sur un LLM, en profitant des endroits où il concatène l’invite du développeur avec une entrée non fiable d’un utilisateur ».

Quelles que soient les conclusions du scientifique, force est d’admettre qu’il est facile de prendre l'Intelligence Artificielle « par les sentiments ». Cette technique de changement de contexte n’a pas échappé aux cybercriminels de tout poil. Ces derniers exploitent d’ores et déjà les possibilités de l’IA. Selon Europol, ChatGPT est même devenu l’outil préféré des pirates.


Réagissez à cet article !

Demandez nos derniers articles !

Les PC Windows plantent trois fois plus souvent que les Mac d’Apple, selon ce rapport

La fiabilité des Mac et autres iPhone est régulièrement mise en avant par la marque à la pomme. Et un nouveau rapport, baptisé « State of Digital Workspace », vient…

PC

Android renforce sa lutte contre le sideloading, préparez-vous à une attente interminable

Google met en place de nouvelles mesures pour sécuriser le téléchargement d’applications tierces sur Android. Il faudra en effet se soumettre à un délai de 24 h pour pouvoir profiter…

Star Wars Maul – Seigneur de l’ombre : date de sortie, histoire, casting, ce qu’il faut retenir de la nouvelle série Disney+

C’est l’événement que les fans de la galaxie lointaine attendaient pour ce printemps 2026. Après des années de rumeurs, le plus célèbre des apprentis Sith revient enfin sur Disney+ dans…

Cette extension très populaire pour Google Chrome met vos données personnelles en danger, faites attention

Des chercheurs en cybersécurité viennent de tirer la sonnette d’alarme. Une extension de Google Chrome permettrait en effet à des hackers de subtiliser vos données en un rien de temps……

Android 17 : grâce cette fonctionnalité inédite, la vitesse de charge des smartphones s’améliore du tout au tout

À l’occasion de la bêta 3 d’Android 17, Google est en train de tester une fonctionnalité bien pratique. Cette dernière, baptisée « Priority Charging », permet de mettre en pause…

Parents, vous devez appliquer ces conseils pour protéger l’empreinte numérique de vos enfants

En tant que parent, vous devez penser dès leur plus jeune âge à contrôler l’empreinte numérique que laissent vos enfants sur internet. Voici quelques bonnes pratiques à appliquer. La protection…

iOS 27 : calendrier de sortie, iPhone compatibles, tout ce que l’on sait de la future mise à jour majeure d’Apple

iOS 27 est la prochaine version majeure du système d’exploitation d’Apple. Cette mise à jour est annoncée comme celle qui permettra enfin à la marque à la pomme d’entrer vraiment…

Samsung prépare un Galaxy Z Fold inédit, de nouvelles lunes entourent Jupiter, c’est le récap’ de la semaine

Un Galaxy Z Fold Wide en approche, quinze satellites naturels découverts dans l’espace, le Galaxy Z Fold 8 se dévoile, c’est le récap’ de la semaine. Cette semaine, alors que…

L’intelligence artificielle commence à se rebeller, à faire n’importe quoi et c’est vraiment flippant

Triche, mensonge, suppression de données : l’intelligence artificielle commence à se retourner contre les utilisateurs. C’est en tout cas ce que laisse entendre une nouvelle étude financée par l’AI Security…

IA

Quand et comment regarder le GP F1 du Japon en direct et gratuitement ce dimanche ?

Le GP F1 du Japon se dispute ce dimanche 29 mars sur le mythique circuit de Suzuka, et avec un départ à 7h du matin heure française, il va falloir…