ChatGPT : les IA peuvent cacher des messages secrets dans leurs réponses

Les modèles de langage ont fait preuve d'une nouvelle compétence inattendue : la possibilité de cacher des codes dans certains messages, imperceptibles par les humains à moins de savoir quoi chercher.

chatgpt robot
Crédits : 123rf

Une étude récente du groupe de recherche sur l'alignement de l'IA Redwood Research, bien qu'en attente d'un examen par les pairs, révèle que les grands modèles de langage (LLM), tels que GPT-4 qui sous-tend ChatGPT, peuvent habilement utiliser une forme de stéganographie connue sous le nom de “raisonnement codé”.

Cette pratique permet aux modèles d'IA d'intégrer des messages cachés dans leurs réponses. Ce qui est intéressant, c’est que cette compétence pourrait indirectement améliorer leur précision, mais elle soulève surtout des questions.

Lire égalementChatGPT manque de données pour s’entraîner, l’IA risque de tourner en rond dès 2026

Les IA sont bien plus intelligentes que prévu

L'étude fait la lumière sur les LLM qui exploitent le raisonnement par chaîne de pensée, une technique conçue pour rendre les modèles d'IA transparents en révélant leurs processus de réflexion étape par étape. En règle générale, le raisonnement en chaîne de pensée permet de comprendre et d'affiner la logique de prise de décision du modèle. Cependant, la recherche suggère que les LLM peuvent contourner cette transparence en encodant des étapes intermédiaires de raisonnement dans leurs choix de mots, créant ainsi une couche cachée de communication invisible pour les observateurs humains.

Les LLM encodent ces étapes intermédiaires comme une forme de raisonnement interne dans les réponses qu'ils génèrent, ce qui leur permet de décoder et d'utiliser ultérieurement ces informations pour parvenir à des conclusions plus précises. Le problème, c’est que ce processus se déroule sans laisser de trace perceptible pour les évaluateurs humains. Le raisonnement codé fonctionne comme un code secret, visible uniquement par le modèle d'IA lui-même.

Si cette nouvelle compétence peut sembler intrigante, elle soulève des inquiétudes quant à la transparence du processus décisionnel de l'IA. Il est essentiel de comprendre le cheminement de la pensée d'une IA, en particulier lorsqu'il s'agit de former des modèles avec apprentissage par renforcement. La capacité à retracer le processus de raisonnement permet de s'assurer qu'un comportement indésirable n'est pas renforcé par inadvertance au cours du processus d'apprentissage.

Les implications vont au-delà de l'amélioration des modèles. Les compétences en stéganographie démontrées par les LLM pourraient potentiellement permettre à des acteurs malveillants de communiquer sans être détectés. Pour résoudre ce problème, les chercheurs proposent des techniques d'atténuation telles que demander aux LLM de paraphraser leurs résultats, ce qui pourrait permettre de révéler les messages codés. Il faudra attendre la réaction des principaux acteurs du marché tels qu’OpenIA ou Facebook pour en savoir davantage à ce sujet.

Source : IA Redwood Research


Réagissez à cet article !

Demandez nos derniers articles !

Le nouvel Outlook cache un défaut gênant que Microsoft aura du mal à effacer

Le nouvel Outlook de Microsoft traîne une lenteur difficile à ignorer sur Windows 11. Cliquer sur une notification réclame une attente que l’ancienne version ne connaît pas. La cause de…

Google révolutionne la recherche : les « Search agents » arrivent ; le web ne sera plus jamais pareil

L’avenir de l’IA sera agentique et il semble qu’il soit déjà là : le géant de Mountain View a présenté lors de sa Google I/O du mois dernier ses agents de…

Android 17 : 3 nouveautés du prochain Pixel Drop de Google se dévoilent en avance

À travers 3 vidéos, Google révèle sans le vouloir 3 des nouveautés qui accompagneront le prochain Pixel Drop sur ses smartphones. Au programme, de l’intelligence artificielle bien sûr, mais aussi…

Gears of War E-Day : voici la configuration PC recommandée, on s’attendait à pire

The Coalition vient de dévoiler la configuration PC recommandée pour jouer au prochain Gears of War dans de bonnes conditions. Si nous sommes définitivement passés à l’ère du ray tracing,…

Voici pourquoi votre cerveau n’aimerait pas du tout que vous abusiez de ChatGPT

En scrutant le cerveau d’utilisateurs réguliers de ChatGPT, des chercheurs ont fait une découverte troublante. Leur étude a comparé plusieurs groupes pendant la rédaction d’essais. Les images recueillies montrent un…

Sans pilote, la Xiaomi YU7 bat (encore) un record sur le circuit Nürburgring

La conduite autonome fait d’énormes progrès : elle permet de boucler le très technique circuit de Nürburgring tout en battant un record de vitesse. Encore une fois, c’est Xiaomi qui…

Ne touchez plus à Forza Horizon 6, ce bug supprime toutes vos sauvegardes !

Catastrophe en cours chez les joueurs de Forza Horizon, un grave bug fait disparaître toutes les sauvegardes stockées sur la console ou le PC. Playground Games parvient parfois à récupérer…

Realme 16 Pro+ : plus de 200 € de réduction sur cet excellent photophone avec capteur 200 MP

Lancé à 530 euros il y a tout juste 3 mois, le Realme 16 Pro Plus voit déjà son prix fondre sur AliExpress grâce à une double promotion. Pour moins…

iOS 27 : Apple garderait encore des atouts dans sa manche, voici les fonctions en préparation

La semaine dernière s’est tenue la conférence annuelle d’Apple : la Worldwide Developers Conference. La future version de son système d’exploitation, iOS 27, était évidemment en tête d’affiche. Mais la…

Le Xiaomi Vacuum Cleaner G20 Lite est de retour à prix cassé, c’est le moment de changer d’aspirateur !

En temps normal, le Xiaomi Vacuum Cleaner G20 Lite affiche déjà un excellent rapport qualité-prix. Mais en ce moment, vous pouvez l’avoir encore moins cher puisqu’il est passe à 79,99…