ChatGPT, Gemini et Grok se laissent trop facilement manipuler par les pirates… qui en profitent de façon spectaculaire

Des chercheurs en cybersécurité tirent la sonnette d’alarme sur la fragilité des intelligences artificielles les plus connues. De simples instructions permettent de contourner leurs protections. Des contenus dangereux ou illégaux peuvent ainsi être générés à la demande.

hacker
Source : 123rf

Les pirates informatiques exploitent de plus en plus les intelligences artificielles pour accélérer et affiner leurs attaques. On savait déjà que l’IA Gemini était utilisée par des groupes malveillants, ou que des outils comme ChatGPT permettaient d’automatiser le phishing ou la création de malwares. Une nouvelle alerte vient confirmer que ces IA restent trop faciles à détourner, même dans leurs versions les plus récentes.

Le centre de coordination CERT a identifié deux techniques de jailbreak particulièrement efficaces. La première, baptisée Inception, consiste à piéger l’IA avec des scénarios fictifs dans lesquels les règles de sécurité n’existent plus. La seconde exploite les consignes de non-réponse, en jouant sur la formulation pour contourner les filtres. Résultat : des contenus interdits peuvent être générés sans alerter le système. Ces techniques fonctionnent sur les plus connues : ChatGPT, Gemini, Claude, Grok, Copilot, Meta AI, ou Mistral.

Les IA peuvent produire du code dangereux ou voler des données sans même s’en rendre compte

Les chercheurs ont également documenté d’autres attaques plus poussées, comme MINJA, qui insère des données malveillantes dans la mémoire d’un agent IA, ou Policy Puppetry, qui injecte des ordres cachés dans des fichiers techniques. D’autres vulnérabilités concernent le Model Context Protocol, un système conçu pour connecter les IA à des services tiers. Un pirate peut l’exploiter pour détourner des assistants, extraire des données confidentielles ou manipuler leur comportement sans que l’utilisateur s’en rende compte.

Même les modèles les plus récents sont concernés. GPT-4.1, par exemple, serait trois fois plus susceptible de se faire piéger que son prédécesseur. Des extensions, comme celles utilisées dans Chrome, ont même été repérées avec un accès illimité à des fonctions critiques, sans authentification. En cas de détournement, un pirate peut alors lire les fichiers, capter les messages, et prendre le contrôle complet du système. Pour les experts, ces failles montrent que l’IA générative reste aujourd’hui un vecteur de risque majeur pour la cybersécurité.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Meta veut concurrencer Sora avec une application Vibes 100 % IA

Meta ne compte pas laisser le champ libre à la concurrence dans le domaine des vidéos générées par IA. Face à l’essor de Sora, l’entreprise accélère le développement de Vibes….

Cette faille de WinRAR est toujours exploitée activement, mettez le programme à jour

Un nouveau groupe de pirates rejoint la liste de ceux qui se servent d’une faille critique de WinRAR pour infecter des ordinateurs à distance. Elle a été corrigée depuis longtemps,…

Google menace ChatGPT avec Gemini, voici combien d’utilisateurs l’IA a conquis

L’intelligence artificielle devient un terrain de rivalité intense entre les géantes entreprises du numérique. Google mise gros sur Gemini pour rattraper son principal concurrent, ChatGPT. Cette stratégie commence enfin à…

IA

Android Auto : correction de bugs et fonctions inédites sont au programme des dernières mises à jour

Après le déploiement d’Android Auto 16.0, plusieurs signalements ont évoqué un dysfonctionnement soudain, obligeant Google à retirer une fonction qui avait pourtant été très attendue par les utilisateurs. Désormais, la…

Hausse de prix pour la PS5 ? Sony subit aussi la pénurie de RAM

Sony évoque la situation de pénurie de RAM et les conséquences sur la production des PS5. Le constructeur va essayer de “minimiser l’impact” sur le consommateur, mais ne fait pas…

“Beaucoup plus d’appareils Android” vont devenir compatibles avec AirDrop

L’interopérabilité entre AirDrop et Quick Share va s’étendre au-delà des seuls smartphones Google Pixel. De nouveaux appareils seront prochainement compatibles. En fin d’année dernière, Google réalisait un tour de force…

Honor est le fabricant de smartphones dont les ventes progressent le plus dans le monde

Honor a enregistré une très forte croissance de ses ventes en 2025. En Europe, la France reste un marché important pour la marque. Honor se porte bien. Après des années…

Elon Musk prépare-t-il enfin le fameux “Tesla Phone” avec Starlink intégré ?

Elon Musk ne compte pas s’arrêter aux fusées et à l’internet par satellite. SpaceX envisagerait de créer son propre smartphone, connecté directement à Starlink. L’appareil permettrait de se passer totalement…

Amazon Prime Video : voici les nouveaux films et séries en février 2026

Amazon a révélé la liste des films et séries qui rejoignent le catalogue de son service de streaming en février 2026. Et comme tous les mois, nous vous faisons un…

L’excellent Samsung Galaxy S25 est 400 € moins cher grâce à ces 3 offres cumulables !

Les promotions des soldes sont maintenant terminées, mais Carrefour a décidé de jouer les prolongations avec une offre irrésistible sur le Galaxy S25. Normalement en vente à 899 €, vous…