ChatGPT : les IA peuvent cacher des messages secrets dans leurs réponses

Par William Zimmer Le 15/11/2023 0 com

Les modèles de langage ont fait preuve d'une nouvelle compétence inattendue : la possibilité de cacher des codes dans certains messages, imperceptibles par les humains à moins de savoir quoi chercher.

Une étude récente du groupe de recherche sur l'alignement de l'IA Redwood Research, bien qu'en attente d'un examen par les pairs, révèle que les grands modèles de langage (LLM), tels que GPT-4 qui sous-tend ChatGPT, peuvent habilement utiliser une forme de stéganographie connue sous le nom de “raisonnement codé”.

Cette pratique permet aux modèles d'IA d'intégrer des messages cachés dans leurs réponses. Ce qui est intéressant, c’est que cette compétence pourrait indirectement améliorer leur précision, mais elle soulève surtout des questions.

Lire également – ChatGPT manque de données pour s’entraîner, l’IA risque de tourner en rond dès 2026

Les IA sont bien plus intelligentes que prévu

L'étude fait la lumière sur les LLM qui exploitent le raisonnement par chaîne de pensée, une technique conçue pour rendre les modèles d'IA transparents en révélant leurs processus de réflexion étape par étape. En règle générale, le raisonnement en chaîne de pensée permet de comprendre et d'affiner la logique de prise de décision du modèle. Cependant, la recherche suggère que les LLM peuvent contourner cette transparence en encodant des étapes intermédiaires de raisonnement dans leurs choix de mots, créant ainsi une couche cachée de communication invisible pour les observateurs humains.

Les LLM encodent ces étapes intermédiaires comme une forme de raisonnement interne dans les réponses qu'ils génèrent, ce qui leur permet de décoder et d'utiliser ultérieurement ces informations pour parvenir à des conclusions plus précises. Le problème, c’est que ce processus se déroule sans laisser de trace perceptible pour les évaluateurs humains. Le raisonnement codé fonctionne comme un code secret, visible uniquement par le modèle d'IA lui-même.

Si cette nouvelle compétence peut sembler intrigante, elle soulève des inquiétudes quant à la transparence du processus décisionnel de l'IA. Il est essentiel de comprendre le cheminement de la pensée d'une IA, en particulier lorsqu'il s'agit de former des modèles avec apprentissage par renforcement. La capacité à retracer le processus de raisonnement permet de s'assurer qu'un comportement indésirable n'est pas renforcé par inadvertance au cours du processus d'apprentissage.

Les implications vont au-delà de l'amélioration des modèles. Les compétences en stéganographie démontrées par les LLM pourraient potentiellement permettre à des acteurs malveillants de communiquer sans être détectés. Pour résoudre ce problème, les chercheurs proposent des techniques d'atténuation telles que demander aux LLM de paraphraser leurs résultats, ce qui pourrait permettre de révéler les messages codés. Il faudra attendre la réaction des principaux acteurs du marché tels qu’OpenIA ou Facebook pour en savoir davantage à ce sujet.

Source : IA Redwood Research

ChatGPT

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Voir tous les commentaires

Demandez nos derniers articles !

Wonder Man : voici où se place la nouvelle série Disney+ dans la chronologie du MCU
Ça y est, Wonder Man est désormais disponible sur Disney+. Il est donc temps pour les fans du MCU de se poser la question habituelle : quand la série se déroule-t-elle par rapport aux autres films et séries de l’univers…

Disney+ 02/02/2026
Android 16 gagne rapidement du terrain, mais reste encore loin derrière : voici ce que révèlent les chiffres
Google a partagé ses dernières statistiques en matière de répartition des versions d’Android. Elles montrent non seulement quelle est l’itération la plus populaire, mais indiquent également la vitesse de progression des dernières moutures : si la part d’Android 16 croît,…

Smartphones Android 02/02/2026
Votre iPhone pourrait bientôt rivaliser avec un reflex grâce à ce kit étonnant
Les smartphones progressent en photo, mais restent limités face aux appareils professionnels. Un nouveau kit vise à changer cela sur les iPhone Pro. Il promet zoom optique, filtres et carte microSD pour transformer le téléphone en véritable caméra experte. Depuis…

iPhone 02/02/2026
Où est Gemini pour Android Auto ? Deux mois après son annonce, le déploiement est au point mort
Google a presque totalement détruit son Assistant sur Android Auto. Le problème est que son remplaçant, Gemini, se fait toujours attendre. La quasi-totalité des utilisateurs n’en a pas vu la couleur à ce jour. Il était une fois Android Auto…

Voiture 02/02/2026
Cette nouveauté d’iOS 26 protège votre vie privée en agissant sur le pistage de votre position
Apple dévoile une nouvelle option d’iOS 26. Elle permet, dans certains cas, de limiter votre localisation pour éviter qu’elle soit trop précise. Comment fonctionne-t-elle, qui y a droit et comment l’activer ? Il était une fois Apple Activer la localisation…

iPhone 02/02/2026
Alors que l’iPhone 17 Pro fait carton plein, ce modèle peine à convaincre
Les premiers chiffres de ventes de la gamme des iPhone 17 viennent d’être dévoilés. Apple enregistre un fort engouement pour ses modèles haut de gamme. Mais un autre modèle, pourtant mis en avant lors du lancement, semble déjà à la…

iPhone 02/02/2026
Google lance le Project Genie : un créateur de monde dont vous êtes le héros
L’IA de Google montre d’un cran avec Project Genie. L’outil permet de générer tout un monde interactif à partir d’une requête ou d’une photo. Les résultats sont bluffants. Il était une fois Google Quand est-ce que ça va s’arrêter ?…

IA 02/02/2026
VPN gratuit : les meilleures solutions pour naviguer de façon sécurisée
Utiliser Internet peut être compliqué ou dangereux pour notre vie privée et nos données. Dans certains cas, il est donc plus sûr d’utiliser un VPN. Mais si vous ne voulez pas débourser d’argent, optez pour un VPN gratuit. Découvrez notre sélection non exhaustive.

Guides d'achat informatique 02/02/2026
Ce lycéen a dépassé la NASA en découvrant 1,5 million d’objets inconnus dans l’espace
À seulement 18 ans, un lycéen californien a analysé d’anciennes données de la NASA. En quelques semaines, il a découvert 1,5 million d’objets spatiaux encore inconnus. Son algorithme d’IA a surpassé les outils utilisés jusque-là par les chercheurs. L’univers regorge…

Espace 02/02/2026
VPN pour le télétravail : comment bien sécuriser le travail à distance dans un environnement professionnel
Sécuriser ses connexions internet est devenu un enjeu central du télétravail. Que l’on soit salarié, freelance ou indépendant, le VPN s’impose aujourd’hui comme un outil clé pour protéger les données professionnelles et travailler à distance sans exposer ses échanges en…

Sécurité 01/02/2026

Newsletter