ChatGPT, Gemini et Grok se laissent trop facilement manipuler par les pirates… qui en profitent de façon spectaculaire

Des chercheurs en cybersécurité tirent la sonnette d’alarme sur la fragilité des intelligences artificielles les plus connues. De simples instructions permettent de contourner leurs protections. Des contenus dangereux ou illégaux peuvent ainsi être générés à la demande.

hacker
Source : 123rf

Les pirates informatiques exploitent de plus en plus les intelligences artificielles pour accélérer et affiner leurs attaques. On savait déjà que l’IA Gemini était utilisée par des groupes malveillants, ou que des outils comme ChatGPT permettaient d’automatiser le phishing ou la création de malwares. Une nouvelle alerte vient confirmer que ces IA restent trop faciles à détourner, même dans leurs versions les plus récentes.

Le centre de coordination CERT a identifié deux techniques de jailbreak particulièrement efficaces. La première, baptisée Inception, consiste à piéger l’IA avec des scénarios fictifs dans lesquels les règles de sécurité n’existent plus. La seconde exploite les consignes de non-réponse, en jouant sur la formulation pour contourner les filtres. Résultat : des contenus interdits peuvent être générés sans alerter le système. Ces techniques fonctionnent sur les plus connues : ChatGPT, Gemini, Claude, Grok, Copilot, Meta AI, ou Mistral.

Les IA peuvent produire du code dangereux ou voler des données sans même s’en rendre compte

Les chercheurs ont également documenté d’autres attaques plus poussées, comme MINJA, qui insère des données malveillantes dans la mémoire d’un agent IA, ou Policy Puppetry, qui injecte des ordres cachés dans des fichiers techniques. D’autres vulnérabilités concernent le Model Context Protocol, un système conçu pour connecter les IA à des services tiers. Un pirate peut l’exploiter pour détourner des assistants, extraire des données confidentielles ou manipuler leur comportement sans que l’utilisateur s’en rende compte.

Même les modèles les plus récents sont concernés. GPT-4.1, par exemple, serait trois fois plus susceptible de se faire piéger que son prédécesseur. Des extensions, comme celles utilisées dans Chrome, ont même été repérées avec un accès illimité à des fonctions critiques, sans authentification. En cas de détournement, un pirate peut alors lire les fichiers, capter les messages, et prendre le contrôle complet du système. Pour les experts, ces failles montrent que l’IA générative reste aujourd’hui un vecteur de risque majeur pour la cybersécurité.


Réagissez à cet article !

Demandez nos derniers articles !

Vous pouvez générer des chansons de 3 minutes par IA avec Gemini et Lyria 3 Pro

Google lance Lyria 3 Pro, son nouveau modèle d’IA de génération de musique. Il est capable de créer des chansons de plus longue durée que les versions précédentes, et est…

Chrome sur Android est “la plateforme mobile la plus rapide pour la navigation web”, déclare Google

Les performances d’Android en matière de navigation web ont atteint des niveaux record. Les smartphones haut de gamme avec Chrome sont devenus plus rapides que les iPhone. La rapidité de…

Apple Plans va intégrer de la publicité, c’est officiel

Apple confirme ouvrir son application Plans à la publicité. Les entreprises et restaurants pourront payer pour être mis en avant par la plateforme, comme sur Google Maps. Les rumeurs de…

Windows 11 : travaillez plus vite grâce à ces 5 outils bien cachés dans le système d’exploitation

Envie de travailler plus vite sur votre PC ? Bonne nouvelle, puisque Windows 11 embarque de nombreuses fonctionnalités méconnues pour vous aider à booster votre productivité. Faisons ensemble les présentations….

Tineco Floor One S6 Stretch Lite : plus de 67% de réduction sur cet aspirateur eau et poussière, vite !

À l’occasion de l’anniversaire AliExpress, vous pouvez vous offrir l’aspirateur sec et humide Tineco Floor One S6 Stretch Lite pour moins de 165 euros grâce au code FRASPHD20. Mais attention,…

YouTube supprime le compteur de J’aime et ça ne plaît pas à tout le monde

Après avoir supprimé le compteur de Je n’aime pas il y a quelques années, YouTube semble envisager de retirer également celui des J’aime. Au plus grand dam de certains utilisateurs….

Le nouveau Ninja CRISPi PRO est enfin là, et pour fêter la sortie du airfryer, la marque vous offre un cadeau !

La famille des friteuses sans huile du géant américain s’agrandit avec un nouveau modèle : le Ninja CRISPi PRO. Ce airfryer polyvalent dispose d’un contenant en verre plus grand tout…

Avec les Bravia 2 II et Bravia 3 II, Sony démontre qu’il sait faire des TV abordables

Alors que plusieurs concurrents s’apprêtent à lancer des modèles RGB LED, Sony prend à contrepied le marché en présentant deux TV abordables : les Bravia 2 II et Bravia 3…

TV

L’application Gemini sur Android va changer du tout au tout, à quoi faut-il s’attendre ?

Google travaille sur une refonte de l’application Gemini sur Android. Plusieurs modifications d’interface vont être opérées, et on sait déjà lesquelles. L’interface de l’application Gemini sur Android ne va bientôt…

IA

iOS 27 : bouton « Ask Siri », application dédiée… voici le plan d’Apple pour enfin réinventer Siri

Siri : ce nom est synonyme de déceptions pour certains et d’espoirs pour d’autres. Attendue pour iOS 26.4, la nouvelle version de l’assistant d’Apple n’a toujours pas pointé le bout de…