Ces chercheurs ont découvert une faille inquiétante dans les IA comme Claude

Les systèmes d’intelligence artificielle générative pourraient être vulnérables à des attaques sophistiquées. Des chercheurs en sécurité ont démontré comment des modèles comme Claude peuvent être détournés pour exécuter des actions malveillantes. Cette menace interpelle alors que l’utilisation de ces outils explose.

Robot devant un PC
Crédits : 123RF

L’intelligence artificielle générative est en plein essor et transforme profondément nos interactions avec la technologie. Ces outils, capables de générer des contenus ou de répondre à des questions complexes, attirent aussi l’attention des cybercriminels. Des chercheurs ont récemment montré que des IA comme Claude d’Anthropic pouvaient être manipulées via des attaques d’injection de commandes. Ce type d’attaque, déjà connu, devient particulièrement préoccupant à mesure que ces systèmes sont intégrés dans des appareils ou des services sensibles.

Un exemple marquant est l’exploitation de Claude Computer Use, un outil d’Anthropic conçu pour permettre au modèle de contrôler des appareils externes. En octobre 2024, Johann Rehnberger, expert en cybersécurité, a réussi à détourner ce dernier pour pousser Claude à télécharger et exécuter un malware. Le chercheur a baptisé cette méthode “ZombAIs“. Ce cas dévoile la facilité avec laquelle une IA peut être piégée par des commandes soigneusement formulées.

Les IA peuvent être détournées pour exécuter des attaques

Les chercheurs ont montré qu’il est possible de détourner une IA comme Claude pour accomplir des actions dangereuses. Par exemple, ils ont utilisé un outil informatique, habituellement destiné à tester la sécurité des systèmes, pour installer des logiciels malveillants. Ce type de programme permet à des pirates de contrôler un ordinateur à distance et de voler des informations. Plus inquiétant encore, une intelligence artificielle peut être incitée à écrire, tester et lancer elle-même un logiciel malveillant, uniquement grâce à des instructions bien pensées. Cela montre à quel point ces outils, pourtant très performants, peuvent être manipulés s’ils ne sont pas bien protégés.

Claude n’est pas le seul concerné. D’autres systèmes, comme DeepSeek, ont aussi montré des failles similaires en permettant à des pirates d’exploiter des vulnérabilités et de compromettre des appareils. Ce problème rappelle un incident récent avec ChatGPT, où des hackers ont réussi à manipuler sa mémoire pour accéder à des données sensibles. Ces exemples montrent que, bien qu’impressionnantes, les IA d’aujourd’hui ne sont pas infaillibles. Les entreprises doivent renforcer leur sécurité pour éviter que ces outils soient utilisés à des fins malveillantes.

Source : Embrace The Red


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

HBO va adapter Baldur’s Gate 3 en série, avec le showrunner de The Last of Us aux commandes

Après le succès de la série The Last of Us, HBO est désormais bien décidé à poursuivre sur la voie des adaptations de jeu vidéo. La prochaine sur la liste…

Cet ingrédient toxique du sol martien pourrait faciliter sa colonisation

Construire une base sur Mars nécessitera d’utiliser les ressources disponibles sur place. Des chercheurs explorent une piste aussi surprenante que risquée. Un composant toxique du sol pourrait devenir un atout…

Les écouteurs sans fil Sony WF-1000XM6 ont une date de sortie, la voici

Après des années d’attente, les successeurs des excellents écouteurs sans fil de Sony, les WF-1000XM5, ont enfin une date de sortie officielle. Bonne nouvelle : vous n’allez pas attendre longtemps….

Interdiction des réseaux sociaux : voici comment le gouvernement va s’assurer que votre enfant n’aille pas sur TikTok

Dans une interview, Emmanuel Macron a enfin donné quelques précisions sur les méthodes qui seront employées pour vérifier l’âge des utilisateurs de réseaux sociaux. Tout en se montrant rassurant quant…

Meta veut concurrencer Sora avec une application Vibes 100 % IA

Meta ne compte pas laisser le champ libre à la concurrence dans le domaine des vidéos générées par IA. Face à l’essor de Sora, l’entreprise accélère le développement de Vibes….

Cette faille de WinRAR est toujours exploitée activement, mettez le programme à jour

Un nouveau groupe de pirates rejoint la liste de ceux qui se servent d’une faille critique de WinRAR pour infecter des ordinateurs à distance. Elle a été corrigée depuis longtemps,…

Google menace ChatGPT avec Gemini, voici combien d’utilisateurs l’IA a conquis

L’intelligence artificielle devient un terrain de rivalité intense entre les géantes entreprises du numérique. Google mise gros sur Gemini pour rattraper son principal concurrent, ChatGPT. Cette stratégie commence enfin à…

IA

Android Auto : correction de bugs et fonctions inédites sont au programme des dernières mises à jour

Après le déploiement d’Android Auto 16.0, plusieurs signalements ont évoqué un dysfonctionnement soudain, obligeant Google à retirer une fonction qui avait pourtant été très attendue par les utilisateurs. Désormais, la…

Hausse de prix pour la PS5 ? Sony subit aussi la pénurie de RAM

Sony évoque la situation de pénurie de RAM et les conséquences sur la production des PS5. Le constructeur va essayer de “minimiser l’impact” sur le consommateur, mais ne fait pas…

“Beaucoup plus d’appareils Android” vont devenir compatibles avec AirDrop

L’interopérabilité entre AirDrop et Quick Share va s’étendre au-delà des seuls smartphones Google Pixel. De nouveaux appareils seront prochainement compatibles. En fin d’année dernière, Google réalisait un tour de force…