L’IA pourrait bientôt “penser” d’une manière qu’on ne comprend pas

Aujourd'hui, on peut surveiller le cheminement de pensée des modèles d'IA pour détecter les erreurs et les dangers. Mais prochainement, ils pourraient devenir assez intelligents pour dissimuler la manière dont ils arrivent à un résultat, une action ou un raisonnement.

Robot IA contre humain aux échecs
Crédit : 123RF

À mesure qu'elle devient plus performante, l'IA se complexifie, rendant de plus en plus difficile la possibilité de comprendre comment elle en arrive à un résultat ou à une “réflexion”. C'est d'autant plus vrai qu'on sait que l'IA peut apprendre d'elle-même, ce qui signifie qu'elle peut s'adapter au-delà des bases de données ou des paramètres qui lui sont initialement soumis.

Une récente étude sur la sécurité de l'IA vient d'être publiée. Elle regroupe des dizaines de chercheurs spécialisés, appartenant à des entreprises à la pointe de l'IA : Google, Amazon, OpenAI, Meta, Anthropic… Cette étude porte plus exactement sur le contrôle des chaînes de pensée de l'IA. Pouvoir surveiller et analyser le “cheminement de pensée” exact des IA limiterait les risques que les agents d'IA avancés, dont le fonctionnement est opaque, fassent des erreurs d'interprétation, ou décident d'agir contre les règles qui leur ont été imposées. Mais ce n'est pas si simple…

Les modèles d'IA pourront délibérément occulter des informations sur leur chaîne de pensée

La surveillance des chaînes de pensée comporte en effet des limites. Le rapport souligne qu'elle peut permettre de détecter certains comportements anormaux, mais qu'elle ne fournit pas à elle seule des preuves solides de sécurité. Ce n'est pas parce qu'on met en place un système de contrôle des chaînes de pensée, que l'IA ne peut pas dysfonctionner en dehors de ce type de surveillance. “Il faut veiller à ne pas créer un faux sentiment de sécurité basé sur une telle surveillance”, insistent les chercheurs.

En outre, la surveillance des tâches nécessitant un raisonnement avancé peut ne pas détecter tous les dangers pertinents. “La surveillance des chaînes de pensée pourrait cesser de fonctionner dans les modèles plus avancés, conscients de la situation. Les futurs modèles pourraient être capables d'éviter la détection en neutralisant leur propension à penser à voix haute et, lorsque le raisonnement est requis, en l'obscurcissant délibérément”, estiment les auteurs de l'étude.

D'après eux, il faut réfléchir dès maintenant à des moyens de conserver une bonne visibilité des chaînes de pensée des modèles d'IA dans le futur pour que ceux-ci, bien plus puissants que les modèles actuels, puissent être exploités dans une relative sécurité.


Réagissez à cet article !

Demandez nos derniers articles !

Nvidia déploie le pilote GeForce Game Ready 596.21, vous en avez besoin pour jouer à Pragmata

Le pilote GeForce Game Ready 596.21 de Nvidia est disponible au téléchargement. Il optimise le système du PC pour joueur à Pragmata dans les meilleures conditions. Pragmata sort ce 17…

Gemini s’inspire de vos souvenirs Google Photos pour générer des images IA plus personnelles

Vos clichés stockés dans Google Photos vont pouvoir servir à Gemini pour que l’assistant IA génère des images qui s’en inspirent. Pratique ou effrayant ?  Personal Intelligence est un mode…

IA

Ces 10 jeux vidéo chill et cosy réduisent le stress, selon cette étude

Le jeu vidéo est une échappatoire qui permet d’évacuer le stress, mais certains jeux sont plus relaxants que d’autres. Une étude a sélectionné les 10 meilleurs jeux pour se détendre,…

Galaxy Tab A11+ : plus de 53% de réduction sur la tablette Samsung, alerte prix sacrifié !

En ce moment, AliExpress propose de très nombreuses réductions sur son site internet accompagnées d’une série de codes promo pour obtenir les meilleurs prix possibles. C’est le cas de la…

Bon plan iPhone 16e : avec cette grosse chute de prix, le smartphone n’a jamais été aussi peu cher !

Depuis la récente sortie d’ liPhone 17e, le prix de l’iPhone 16e a considérablement chuté. Alors qu’il était proposé à 719 €, vous pouvez actuellement vous offrir la version reconditionnée…

Ce scandale Google pousse des milliers d’utilisateurs à abandonner Android pour des alternatives plus sûres

De plus en plus d’utilisateurs abandonnent Android après de nouvelles révélations sur les pratiques de Google en matière de données. Un étudiant affirme que l’entreprise a transmis ses informations aux…

Ni Ultra, ni Pro, le Xiaomi 17 Max est une réalité, et serait équipé d’une batterie gigantesque

Le Xiaomi 17 Max pourrait bientôt être annoncé. On connait déjà une partie de sa fiche technique, et c’est la capacité de sa batterie qui se démarque le plus. Xiaomi…

Les IA Claude, ChatGPT et Gemini cachent une faille qui permet de s’introduire dans n’importe quel système connecté

Des experts en sécurité ont découvert une faille critique dans le protocole qui connecte Claude, ChatGPT et Gemini au monde extérieur. Des centaines de milliers de systèmes sont exposés. Pourtant,…

IA

L’Univers a ses règles, mais 400 milliards de planètes invisibles ont décidé de le défier avec cette particularité surprenante

Le cerveau humain déteste le vide et l’incertitude, alors il crée des catégories pour y ranger tout ce qui l’entoure. Mais certains objets refusent d’entrer dans des cases et suivent…

iOS 27 : calendrier de sortie, iPhone compatibles, tout ce que l’on sait de la future mise à jour majeure d’Apple

iOS 27 est la prochaine version majeure du système d’exploitation d’Apple. Cette mise à jour est annoncée comme celle qui permettra enfin à la marque à la pomme d’entrer vraiment…