ChatGPT, Gemini et Grok se laissent trop facilement manipuler par les pirates… qui en profitent de façon spectaculaire

Des chercheurs en cybersécurité tirent la sonnette d’alarme sur la fragilité des intelligences artificielles les plus connues. De simples instructions permettent de contourner leurs protections. Des contenus dangereux ou illégaux peuvent ainsi être générés à la demande.

hacker
Source : 123rf

Les pirates informatiques exploitent de plus en plus les intelligences artificielles pour accélérer et affiner leurs attaques. On savait déjà que l’IA Gemini était utilisée par des groupes malveillants, ou que des outils comme ChatGPT permettaient d’automatiser le phishing ou la création de malwares. Une nouvelle alerte vient confirmer que ces IA restent trop faciles à détourner, même dans leurs versions les plus récentes.

Le centre de coordination CERT a identifié deux techniques de jailbreak particulièrement efficaces. La première, baptisée Inception, consiste à piéger l’IA avec des scénarios fictifs dans lesquels les règles de sécurité n’existent plus. La seconde exploite les consignes de non-réponse, en jouant sur la formulation pour contourner les filtres. Résultat : des contenus interdits peuvent être générés sans alerter le système. Ces techniques fonctionnent sur les plus connues : ChatGPT, Gemini, Claude, Grok, Copilot, Meta AI, ou Mistral.

Les IA peuvent produire du code dangereux ou voler des données sans même s’en rendre compte

Les chercheurs ont également documenté d’autres attaques plus poussées, comme MINJA, qui insère des données malveillantes dans la mémoire d’un agent IA, ou Policy Puppetry, qui injecte des ordres cachés dans des fichiers techniques. D’autres vulnérabilités concernent le Model Context Protocol, un système conçu pour connecter les IA à des services tiers. Un pirate peut l’exploiter pour détourner des assistants, extraire des données confidentielles ou manipuler leur comportement sans que l’utilisateur s’en rende compte.

Même les modèles les plus récents sont concernés. GPT-4.1, par exemple, serait trois fois plus susceptible de se faire piéger que son prédécesseur. Des extensions, comme celles utilisées dans Chrome, ont même été repérées avec un accès illimité à des fonctions critiques, sans authentification. En cas de détournement, un pirate peut alors lire les fichiers, capter les messages, et prendre le contrôle complet du système. Pour les experts, ces failles montrent que l’IA générative reste aujourd’hui un vecteur de risque majeur pour la cybersécurité.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Android Auto : correction de bugs et fonctions inédites sont au programme des dernières mises à jour

Après le déploiement d’Android Auto 16.0, plusieurs signalements ont évoqué un dysfonctionnement soudain, obligeant Google à retirer une fonction qui avait pourtant été très attendue par les utilisateurs. Désormais, la…

Hausse de prix pour la PS5 ? Sony subit aussi la pénurie de RAM

Sony évoque la situation de pénurie de RAM et les conséquences sur la production des PS5. Le constructeur va essayer de “minimiser l’impact” sur le consommateur, mais ne fait pas…

“Beaucoup plus d’appareils Android” vont devenir compatibles avec AirDrop

L’interopérabilité entre AirDrop et Quick Share va s’étendre au-delà des seuls smartphones Google Pixel. De nouveaux appareils seront prochainement compatibles. En fin d’année dernière, Google réalisait un tour de force…

Honor est le fabricant de smartphones dont les ventes progressent le plus dans le monde

Honor a enregistré une très forte croissance de ses ventes en 2025. En Europe, la France reste un marché important pour la marque. Honor se porte bien. Après des années…

Elon Musk prépare-t-il enfin le fameux “Tesla Phone” avec Starlink intégré ?

Elon Musk ne compte pas s’arrêter aux fusées et à l’internet par satellite. SpaceX envisagerait de créer son propre smartphone, connecté directement à Starlink. L’appareil permettrait de se passer totalement…

Amazon Prime Video : voici les nouveaux films et séries en février 2026

Amazon a révélé la liste des films et séries qui rejoignent le catalogue de son service de streaming en février 2026. Et comme tous les mois, nous vous faisons un…

L’excellent Samsung Galaxy S25 est 400 € moins cher grâce à ces 3 offres cumulables !

Les promotions des soldes sont maintenant terminées, mais Carrefour a décidé de jouer les prolongations avec une offre irrésistible sur le Galaxy S25. Normalement en vente à 899 €, vous…

La matière noire est-elle encore insaisissable ? Cette particule « impossible » venue de l’espace en serait la clé

Les scientifiques ont détecté en 2023 une particule « impossible ». Sa charge énergétique est si extrême qu’elle bouleverse les modèles établis. Pour tenter de l’expliquer, les chercheurs avancent une hypothèse ambitieuse….

Orange TV accueille de nouvelles chaînes et ça devrait ravir les amateurs de sport

Orange TV change sa numérotation et en profite pour intégrer de nouvelles chaînes dans son offre. Les suiveurs de la Ligue 1 ou des JO d’hiver sont particulièrement bien servis. …

TV

Spotify s’attaque à Amazon avec un pari étonnant

Spotify ne se contente plus de la musique et des podcasts. La plateforme prépare une incursion surprenante sur un terrain que l’on pensait réservé à Amazon. Spotify a démarré l’année…