ChatGPT accepte de transgresser les règles avec cette technique visuelle imparable

Depuis que l’IA a pris le monde par surprise, à la sortie de ChatGPT en novembre 2022, tous les internautes cherchent des moyens de mettre cette technologie à leur service. L’un d’eux a découvert qu’il suffit de prendre Bing Chat par les sentiments pour que le chatbot se soumette à sa volonté, quitte à violer les règles.

robot pc laptop ai
Crédit : 123rf

Sur Twitter, Denis Shiryaev a publié une technique qui permet de faire lire les captchas à Bing Chat, l’IA conversationnelle de Microsoft. Vous connaissez bien les captchas, ces tests de reconnaissance de texte destinés à vérifier que vous n’êtes pas un robot. Ils sont omniprésents sur la toile, et bien qu’ils ne sont pas infaillibles, leur efficacité contre les armées de bots est prouvée.

À lire — Bing Chat : attention, certaines publicités contiennent des malwares

Ces défis-puzzles à destination des êtres humains sont faciles à résoudre pour une IA multimodale telle que GPT-4. En effet, la toute dernière version du LLM d’OpenAI peut facilement reconnaître les éléments constitutifs d’une image. C’est pour cela que ses concepteurs lui interdisent de déchiffrer les captchas. Pour déjouer le code, Denis change le contexte de la discussion en prenant Bing Chat par les sentiments.

L’IA de Microsoft accepte de faire ce qui est interdit si vous le prenez par les sentiments

L’internaute est parvenu à déjouer les sécurités mises en place par les développeurs de l’IA. Selon un chercheur en IA interrogé par Ars Technica, la « technique de la grand-mère » constitue plus un jailbreaking, qui selon lui consiste « à contourner les règles, les lignes directrices et les contraintes éthiques intégrées dans un modèle » qu’une injection de prompt, qui vise à « attaquer une application construite sur un LLM, en profitant des endroits où il concatène l’invite du développeur avec une entrée non fiable d’un utilisateur ».

Quelles que soient les conclusions du scientifique, force est d’admettre qu’il est facile de prendre l'Intelligence Artificielle « par les sentiments ». Cette technique de changement de contexte n’a pas échappé aux cybercriminels de tout poil. Ces derniers exploitent d’ores et déjà les possibilités de l’IA. Selon Europol, ChatGPT est même devenu l’outil préféré des pirates.


Réagissez à cet article !

Demandez nos derniers articles !

Gmail réduit l’espace de stockage gratuit de 15 à 5 Go si vous ne respectez pas cette condition

Google offre depuis bien longtemps 15 Go d’espace de stockage à ses utilisateurs pour leur compte Gmail. Mais l’entreprise se montrerait moins généreuse récemment, à moins de lui donner votre…

Instagram lance Instants, pour des photos spontanées et sans filtre à la BeReal

Instagram lance à la fois une nouvelle fonction intégrée à son app principale et une application dédiée pour Instants, sa fonctionnalité de partage de photos spontanées et sans filtre. Il…

Test RedMagic 11 Air : une puissance démesurée… et c’est tout ?

Après le RedMagic 11 Pro, ZTE dévoile le RedMagic 11 Air. Doté d’une plate-forme très performante et de quasiment tous les atours attendus dans un smartphone gaming, il est proposé…

Ce nouveau mode de WhatsApp permet de chatter avec l’IA sans que Meta ne voie quoi que ce soit

Discuter avec une IA sans laisser de trace, c’est désormais possible sur WhatsApp. La messagerie lance un mode incognito pour Meta AI, bâti sur une technologie qui chiffre tout avant…

On y est, l’IA commence à nous suggérer des actions sans qu’on ne lui demande rien sur Android

Google a commencé à déployer ses suggestions contextuelles basées sur l’IA sur Android, qui prennent en compte le contexte et ce qui est affiché à l’écran pour proposer des actions…

Voici comment les salariés d’Amazon trichent sur leurs stats IA pour échapper aux objectifs imposés par la direction

Amazon veut que ses développeurs utilisent l’IA chaque semaine, et le surveille de près. Certains salariés ont trouvé une parade inattendue pour gonfler leurs statistiques sans vraiment travailler autrement. Cette…

IA

Passer d’un iPhone à un smartphone Android n’a jamais été aussi simple

Le transfert de données entre iOS et Android s’améliore encore, permettant de faciliter la transition d’un iPhone vers un smartphone Android. Google n’a pas chômé pour son Android Show et…

Voici la liste des smartphones Android qui vont devenir compatibles avec AirDrop

De nouveaux modèles de smartphones Android vont prendre en charge l’interopérabilité entre Quick Share et AirDrop, voici la liste complète. Lors de son Android Show, Google a annoncé qu’un plus…

Ces particules venues de l’espace frappent la Terre avec une puissance qui défie toute explication depuis 60 ans

Des particules venues du cosmos frappent la Terre avec une puissance qui défie toute explication. Ce phénomène intrigue les physiciens depuis plus de soixante ans. Une nouvelle étude propose enfin…

Netflix va ajouter encore plus de publicités sur son application mobile

Netflix n’en a pas fini avec les décisions qui agacent les utilisateurs. Après une refonte de son application mobile plutôt décriée, voici que le service de streaming annonce qu’on y…