ChatGPT, Gemini et Grok se laissent trop facilement manipuler par les pirates… qui en profitent de façon spectaculaire

Des chercheurs en cybersécurité tirent la sonnette d’alarme sur la fragilité des intelligences artificielles les plus connues. De simples instructions permettent de contourner leurs protections. Des contenus dangereux ou illégaux peuvent ainsi être générés à la demande.

hacker
Source : 123rf

Les pirates informatiques exploitent de plus en plus les intelligences artificielles pour accélérer et affiner leurs attaques. On savait déjà que l’IA Gemini était utilisée par des groupes malveillants, ou que des outils comme ChatGPT permettaient d’automatiser le phishing ou la création de malwares. Une nouvelle alerte vient confirmer que ces IA restent trop faciles à détourner, même dans leurs versions les plus récentes.

Le centre de coordination CERT a identifié deux techniques de jailbreak particulièrement efficaces. La première, baptisée Inception, consiste à piéger l’IA avec des scénarios fictifs dans lesquels les règles de sécurité n’existent plus. La seconde exploite les consignes de non-réponse, en jouant sur la formulation pour contourner les filtres. Résultat : des contenus interdits peuvent être générés sans alerter le système. Ces techniques fonctionnent sur les plus connues : ChatGPT, Gemini, Claude, Grok, Copilot, Meta AI, ou Mistral.

Les IA peuvent produire du code dangereux ou voler des données sans même s’en rendre compte

Les chercheurs ont également documenté d’autres attaques plus poussées, comme MINJA, qui insère des données malveillantes dans la mémoire d’un agent IA, ou Policy Puppetry, qui injecte des ordres cachés dans des fichiers techniques. D’autres vulnérabilités concernent le Model Context Protocol, un système conçu pour connecter les IA à des services tiers. Un pirate peut l’exploiter pour détourner des assistants, extraire des données confidentielles ou manipuler leur comportement sans que l’utilisateur s’en rende compte.

Même les modèles les plus récents sont concernés. GPT-4.1, par exemple, serait trois fois plus susceptible de se faire piéger que son prédécesseur. Des extensions, comme celles utilisées dans Chrome, ont même été repérées avec un accès illimité à des fonctions critiques, sans authentification. En cas de détournement, un pirate peut alors lire les fichiers, capter les messages, et prendre le contrôle complet du système. Pour les experts, ces failles montrent que l’IA générative reste aujourd’hui un vecteur de risque majeur pour la cybersécurité.


Réagissez à cet article !

Demandez nos derniers articles !

La mise à jour One UI 8.5 est disponible sur de nouveaux smartphones Samsung en version bêta

La bêta de One UI 8.5 débarque sur de nouveaux smartphones de Samsung, incluant des modèles sortis il y a plusieurs années et un appareil de milieu de gamme. Samsung…

Un iPhone Mini à 236 € ? Voici comment profiter de ce bon plan !

Les smartphones récents ont tous de très grands écrans. C’est pratique pour bien voir mais beaucoup moins agréable pour les petites mains. L’iPhone 13 Mini solutionne ce problème tout en…

La pollution lumineuse a explosé en dix ans et ses effets alarment désormais les scientifiques

Depuis 2014, la planète ne s’éteint plus jamais vraiment. Une nouvelle étude satellitaire révèle l’ampleur de la pollution lumineuse dans le monde. Les conséquences sur la faune, la flore et…

Jackery SolarVault 3 : ce système solaire se branche en 5 minutes et fait baisser votre facture d’électricité dès le premier jour

Branché en 5 minutes sur votre balcon, le nouveau système solaire de Jackery stocke l’énergie le jour et alimente votre maison la nuit, sans travaux, sans électricien, et avec 300…

Des anciens ingénieurs d’Apple créent un accessoire IA au design d’iPod Shuffle… qui laisse perplexe

Un petit appareil à attacher à un vêtement qui ressemble aux vieux iPod Shuffle. Ce dispositif baptisé Button entend devenir notre nouveau compagnon IA. Vous souvenez-vous de l’AI Pin de…

IA

Bon plan Ninja Creami Scoop & Swirl : la nouvelle machine à glaces passe à petit prix, vite !

Sortie récemment, la CREAMi Scoop & Swirl est déjà en promotion sur le site officiel de Ninja. Si vous souhaitez faire vos boules et glaces à l’italiennes maison, c’est le…

Les astronautes d’Artemis 2 rentrent sur Terre ce soir à une vitesse qui ferait fondre n’importe quoi

Après avoir repoussé les limites de l’exploration humaine, les astronautes d’Artemis 2 rentrent sur Terre ce soir. La capsule Orion va affronter des températures capables de faire fondre l’acier. Le…

Adobe Reader : ouvrir un simple PDF suffit à activer cette attaque redoutable, voici comment vous protéger

Une faille de sécurité d’Adobe Reader qui n’a pas été corrigée est activement exploitée par les pirates. Cette menace hautement sophistiquée pourrait conduire au piratage à distance des PC infectés….

Attention à cette arnaque concernant les réservations Booking

Des cybercriminels parviennent à accéder à de vraies informations de réservation pour piéger des utilisateurs et leur subtiliser leurs données bancaires et personnelles. Si vous avez l’habitude d’utiliser Booking pour…

Les Pixel 11 seront les premiers smartphones équipés de ces écrans de nouvelle génération

Les nouveaux écrans OLED M16 de Samsung Display seront d’abord intégrés sur les Pixel 11, avant d’arriver sur les iPhone et sur les propres smartphones haut de gamme de Samsung….