ChatGPT, Gemini et Grok se laissent trop facilement manipuler par les pirates… qui en profitent de façon spectaculaire

Des chercheurs en cybersécurité tirent la sonnette d’alarme sur la fragilité des intelligences artificielles les plus connues. De simples instructions permettent de contourner leurs protections. Des contenus dangereux ou illégaux peuvent ainsi être générés à la demande.

hacker
Source : 123rf

Les pirates informatiques exploitent de plus en plus les intelligences artificielles pour accélérer et affiner leurs attaques. On savait déjà que l’IA Gemini était utilisée par des groupes malveillants, ou que des outils comme ChatGPT permettaient d’automatiser le phishing ou la création de malwares. Une nouvelle alerte vient confirmer que ces IA restent trop faciles à détourner, même dans leurs versions les plus récentes.

Le centre de coordination CERT a identifié deux techniques de jailbreak particulièrement efficaces. La première, baptisée Inception, consiste à piéger l’IA avec des scénarios fictifs dans lesquels les règles de sécurité n’existent plus. La seconde exploite les consignes de non-réponse, en jouant sur la formulation pour contourner les filtres. Résultat : des contenus interdits peuvent être générés sans alerter le système. Ces techniques fonctionnent sur les plus connues : ChatGPT, Gemini, Claude, Grok, Copilot, Meta AI, ou Mistral.

Les IA peuvent produire du code dangereux ou voler des données sans même s’en rendre compte

Les chercheurs ont également documenté d’autres attaques plus poussées, comme MINJA, qui insère des données malveillantes dans la mémoire d’un agent IA, ou Policy Puppetry, qui injecte des ordres cachés dans des fichiers techniques. D’autres vulnérabilités concernent le Model Context Protocol, un système conçu pour connecter les IA à des services tiers. Un pirate peut l’exploiter pour détourner des assistants, extraire des données confidentielles ou manipuler leur comportement sans que l’utilisateur s’en rende compte.

Même les modèles les plus récents sont concernés. GPT-4.1, par exemple, serait trois fois plus susceptible de se faire piéger que son prédécesseur. Des extensions, comme celles utilisées dans Chrome, ont même été repérées avec un accès illimité à des fonctions critiques, sans authentification. En cas de détournement, un pirate peut alors lire les fichiers, capter les messages, et prendre le contrôle complet du système. Pour les experts, ces failles montrent que l’IA générative reste aujourd’hui un vecteur de risque majeur pour la cybersécurité.


Réagissez à cet article !

Demandez nos derniers articles !

Vélos électriques Fiido : ces 3 nouveaux modèles remplacent votre voiture et votre équipement de rando

Un VAE capable de tenir 225 km sur une charge et deux cargos familiaux pour en finir avec la deuxième voiture : Fiido lance trois nouveaux modèles. Et si votre…

Pour échapper à la pénurie de RAM, AMD mise sur une idée étonnante

Les prix de la RAM atteignent des sommets et plombent les budgets informatiques. Face à cette flambée, AMD décide de passer à l’offensive. La marque vient de racheter une startup…

20 ans après sa sortie, Google Finance a une application Android

Il aura fallu de longues années, mais cette fois, ça y est : le service Web Google Finance débarque sur Android dans une application dédiée. Elle profite de la refonte…

Cette planète orbite si près de son étoile qu’elle illumine sa surface à son passage

Les exoplanètes réservent encore bien des surprises aux astronomes. L’une d’elles frôle tellement son étoile que leurs champs magnétiques finissent par se relier. Résultat, l’astre se met à briller à…

Jusqu’à 700 € de hausse : Apple augmente le prix de ses produits et ça fait très mal

Tim Cook nous avait prévenus, voilà que la menace a été mise à exécution. Hier, une grande partie du catalogue d’Apple a eu droit à une très forte hausse des…

L’IA aide à lire un parchemin carbonisé par l’éruption du Vésuve il y a 2000 ans

2000 ans après sa rédaction, un parchemin en provenance d’Herculanum, ville détruite par l’éruption du Vésuve, dévoile ses secrets grâce à l’intelligence artificielle. Voici ce que l’on a pu déchiffrer….

Android : un étrange bug fait disparaître les photos stockées sur votre smartphone, voici comment éviter de tout perdre

Sur Reddit, un utilisateur explique avoir découvert un bug faisant disparaître ses photos sur son Nothing Phone 2a. En vérité, celui-ci peut concerner beaucoup plus d’utilisateurs sur d’autres modèles. On…

Ce métier échappera à l’intelligence artificielle, Bill Gates donne une raison toute simple

Bill Gates voit l’intelligence artificielle bouleverser presque tous les secteurs. Le cofondateur de Microsoft épargne pourtant un métier bien précis. Sa raison tient à un détail très humain que personne…

Bose QuietComfort Ultra 2 : avec 100 € de remise, l’excellent casque est à prix cassé pour quelques heures encore !

C’est déjà le dernier jour des Prime Day ! Si vous attendiez une belle offre pour vous offrir l’excellent Bose Casque QuietComfort Ultra 2ème génération, Amazon le propose actuellement 100 €…

Le prix des Xbox Series S et X augmente au 1er août 2026 en France

Microsoft annonce une forte augmentation mondiale du prix de ses consoles Xbox Series S et Series X. C’est la troisième fois en un an que la firme revoit les tarifs…