ChatGPT, Gemini et Grok se laissent trop facilement manipuler par les pirates… qui en profitent de façon spectaculaire

Des chercheurs en cybersécurité tirent la sonnette d’alarme sur la fragilité des intelligences artificielles les plus connues. De simples instructions permettent de contourner leurs protections. Des contenus dangereux ou illégaux peuvent ainsi être générés à la demande.

hacker
Source : 123rf

Les pirates informatiques exploitent de plus en plus les intelligences artificielles pour accélérer et affiner leurs attaques. On savait déjà que l’IA Gemini était utilisée par des groupes malveillants, ou que des outils comme ChatGPT permettaient d’automatiser le phishing ou la création de malwares. Une nouvelle alerte vient confirmer que ces IA restent trop faciles à détourner, même dans leurs versions les plus récentes.

Le centre de coordination CERT a identifié deux techniques de jailbreak particulièrement efficaces. La première, baptisée Inception, consiste à piéger l’IA avec des scénarios fictifs dans lesquels les règles de sécurité n’existent plus. La seconde exploite les consignes de non-réponse, en jouant sur la formulation pour contourner les filtres. Résultat : des contenus interdits peuvent être générés sans alerter le système. Ces techniques fonctionnent sur les plus connues : ChatGPT, Gemini, Claude, Grok, Copilot, Meta AI, ou Mistral.

Les IA peuvent produire du code dangereux ou voler des données sans même s’en rendre compte

Les chercheurs ont également documenté d’autres attaques plus poussées, comme MINJA, qui insère des données malveillantes dans la mémoire d’un agent IA, ou Policy Puppetry, qui injecte des ordres cachés dans des fichiers techniques. D’autres vulnérabilités concernent le Model Context Protocol, un système conçu pour connecter les IA à des services tiers. Un pirate peut l’exploiter pour détourner des assistants, extraire des données confidentielles ou manipuler leur comportement sans que l’utilisateur s’en rende compte.

Même les modèles les plus récents sont concernés. GPT-4.1, par exemple, serait trois fois plus susceptible de se faire piéger que son prédécesseur. Des extensions, comme celles utilisées dans Chrome, ont même été repérées avec un accès illimité à des fonctions critiques, sans authentification. En cas de détournement, un pirate peut alors lire les fichiers, capter les messages, et prendre le contrôle complet du système. Pour les experts, ces failles montrent que l’IA générative reste aujourd’hui un vecteur de risque majeur pour la cybersécurité.


Réagissez à cet article !

Demandez nos derniers articles !

iOS 26.5 est disponible sur iPhone, voici les nouveautés

Apple a déployé la mise à jour vers la version stable d’iOS 26.5 sur ses iPhone. Elle permet notamment le chiffrement de bout en bout pour les messages RCS avec…

Xiaomi Mix Flip : 900 € de réduction sur cet excellent smartphone pliant, c’est une affaire !

Connaissez-vous le Mix Flip ? C’est le modèle de smartphone pliant de Xiaomi qui concurrence le Z Flip de Samsung. S’il était affiché plus de 1300 euros à sa sortie,…

Redmi Pad 2 Pro : la tablette passe à petit prix avec ce nouveau code !

Les French Days sont derrière, mais les promotions continuent sur AliExpress. Si vous cherchez une tablette polyvalente à prix accessible, la Redmi Pad 2 Pro est actuellement à prix cassé….

Marre des appels de démarchage ? Votre smartphone peut déjà les filtrer, voici comment faire

Comme des millions de Français, vous êtes probablement agacés de recevoir chaque jour des coups de fil de la part des démarcheurs. Et si on vous disait que votre smartphone…

La génération de vidéos par IA va encore passer un cap avec Gemini Omni

Google s’apprête à lancer Gemini Omni, un nouveau modèle de génération de vidéos par IA, qui s’annonce encore plus impressionnant que Veo. Google a grandement amélioré son modèle d’IA de…

IA

Attention, ce vélo électrique vendu chez Lidl présente un défaut qui oblige à cesser de l’utiliser

Un test indépendant a révélé un défaut structurel sur un vélo électrique vendu par Lidl. Le guidon présente des fissures qui pourraient conduire à une rupture brutale. Les propriétaires sont…

Les lunettes connectées deviennent l’outil d’une arnaque qui s’en prend aux femmes

Filmer quelqu’un à son insu dans la rue est devenu un jeu d’enfant avec les lunettes connectées. Certains en ont fait une arnaque, publiant les vidéos avant de réclamer de…

Test Samsung Galaxy Buds4 : ces écouteurs semi-ouverts offrent l’expérience la plus complète du marché, à une condition…

Lorsque Samsung a présenté les Galaxy S26, il a également officialisé sa nouvelle génération d’écouteurs : les Galaxy Buds4. La firme sud-coréenne entend non seulement proposer une expérience complète fidèle…

Une ère se termine chez Tesla avec la production des tout derniers Model S et Model X

Le Model S a inventé la voiture électrique moderne. Le Model X a imposé le luxe zéro émission. Toutes deux viennent d’assembler leurs derniers exemplaires, et leur disparition marque bien…

WhatsApp Plus est disponible sur iPhone, à quel prix et pour quels avantages ?

Meta a commencé à rendre disponible son abonnement WhatsApp Plus sur iPhone en Europe. Voici ce que propose cette offre payante, et à quel prix. L’abonnement payant WhatsApp Plus était…