Ces chercheurs ont découvert une faille inquiétante dans les IA comme Claude

Les systèmes d’intelligence artificielle générative pourraient être vulnérables à des attaques sophistiquées. Des chercheurs en sécurité ont démontré comment des modèles comme Claude peuvent être détournés pour exécuter des actions malveillantes. Cette menace interpelle alors que l’utilisation de ces outils explose.

Robot devant un PC
Crédits : 123RF

L’intelligence artificielle générative est en plein essor et transforme profondément nos interactions avec la technologie. Ces outils, capables de générer des contenus ou de répondre à des questions complexes, attirent aussi l’attention des cybercriminels. Des chercheurs ont récemment montré que des IA comme Claude d’Anthropic pouvaient être manipulées via des attaques d’injection de commandes. Ce type d’attaque, déjà connu, devient particulièrement préoccupant à mesure que ces systèmes sont intégrés dans des appareils ou des services sensibles.

Un exemple marquant est l’exploitation de Claude Computer Use, un outil d’Anthropic conçu pour permettre au modèle de contrôler des appareils externes. En octobre 2024, Johann Rehnberger, expert en cybersécurité, a réussi à détourner ce dernier pour pousser Claude à télécharger et exécuter un malware. Le chercheur a baptisé cette méthode “ZombAIs“. Ce cas dévoile la facilité avec laquelle une IA peut être piégée par des commandes soigneusement formulées.

Les IA peuvent être détournées pour exécuter des attaques

Les chercheurs ont montré qu’il est possible de détourner une IA comme Claude pour accomplir des actions dangereuses. Par exemple, ils ont utilisé un outil informatique, habituellement destiné à tester la sécurité des systèmes, pour installer des logiciels malveillants. Ce type de programme permet à des pirates de contrôler un ordinateur à distance et de voler des informations. Plus inquiétant encore, une intelligence artificielle peut être incitée à écrire, tester et lancer elle-même un logiciel malveillant, uniquement grâce à des instructions bien pensées. Cela montre à quel point ces outils, pourtant très performants, peuvent être manipulés s’ils ne sont pas bien protégés.

Claude n’est pas le seul concerné. D’autres systèmes, comme DeepSeek, ont aussi montré des failles similaires en permettant à des pirates d’exploiter des vulnérabilités et de compromettre des appareils. Ce problème rappelle un incident récent avec ChatGPT, où des hackers ont réussi à manipuler sa mémoire pour accéder à des données sensibles. Ces exemples montrent que, bien qu’impressionnantes, les IA d’aujourd’hui ne sont pas infaillibles. Les entreprises doivent renforcer leur sécurité pour éviter que ces outils soient utilisés à des fins malveillantes.

Source : Embrace The Red


Réagissez à cet article !

Demandez nos derniers articles !

The Mandalorian & Grogu : date de sortie, histoire, casting, tout ce qu’il faut savoir sur le retour de Star Wars au cinéma

Le duo le plus célèbre de la galaxie s’apprête à franchir une nouvelle étape. Après trois saisons à succès sur petit écran, Din Djarin et son apprenti Grogu font le…

Des fuites chez Samsung, un logiciel Windows piégé par un malware, c’est le récap’ de la semaine

Samsung dévoile malgré lui ses futurs smartphones pliables, un malware menace les PC Windows, Xiaomi propose de booster vos anciens téléphones, c’est le récap’ de la semaine. Cette semaine, le…

Test Honor 600 Pro : un smartphone équilibré et vraiment convaincant

Après le Honor 600, c’est au tour de sa version « Pro » de passer à la moulinette de nos tests. Plus cher et, surtout, plus ambitieux, le Honor 600 Pro reprend…

L’iPhone 18 Pro aurait une nouvelle technologie d’écran, pour quels bénéfices ?

Apple intégrerait pour la première fois des écrans de technologie LTPO+ pour ses iPhone 18 Pro, plus performants que les affichages LTPO traditionnels. Les iPhone 18 Pro et 18 Pro…

L’aide à la rédaction par IA de Gmail s’améliore, voici ce qui change

L’outil d’aide à la rédaction par IA de Gmail devient plus pertinent en prenant désormais en compte le contexte personnel de l’utilisateur. Des options de personnalisation du ton et du…

Instagram supprime le chiffrement de bout en bout, vos messages privés ne sont plus protégés

La sécurité de vos messages privés sur Instagram a pris un coup. Le réseau social vient d’annoncer la fin de la prise en charge du chiffrement de bout en bout,…

Les consoles portables sous Windows vont gagner en autonomie grâce à cette initiative de Xbox

Le projet Green Leaf de Xbox vise à réduire la consommation d’énergie des jeux afin d’améliorer l’autonomie des consoles portables tournant sous Windows. Xbox est au four et au moulin…

Le air fryer Ninja DualZone XL passe à petit prix en cumulant ces 2 offres, c’est le moment d’en profiter !

Vous cherchez un airfryer polyvalent pour cuisiner pour toute la famille ? La friteuse sans huile Ninja DualZone XL profite d’une grande capacité de 7,6 L divisée en deux zones….

Avec Android 17, l’écran d’accueil va enfin devenir plus personnalisable pour les Pixel

Google pourrait enfin laisser les utilisateurs supprimer la fameuse barre de recherche de l’écran d’accueil des Pixel dans une prochaine version d’Android 17. Le widget de barre de recherche Google…

Une fonctionnalité discrète mais très appréciée de Google Photos disparaît cet été. Elle concerne les utilisateurs qui sauvegardent leurs photos depuis un ordinateur. Google a déjà fixé les dates, et…

PC