L’IA pourrait bientôt “penser” d’une manière qu’on ne comprend pas

Aujourd'hui, on peut surveiller le cheminement de pensée des modèles d'IA pour détecter les erreurs et les dangers. Mais prochainement, ils pourraient devenir assez intelligents pour dissimuler la manière dont ils arrivent à un résultat, une action ou un raisonnement.

Robot IA contre humain aux échecs
Crédit : 123RF

À mesure qu'elle devient plus performante, l'IA se complexifie, rendant de plus en plus difficile la possibilité de comprendre comment elle en arrive à un résultat ou à une “réflexion”. C'est d'autant plus vrai qu'on sait que l'IA peut apprendre d'elle-même, ce qui signifie qu'elle peut s'adapter au-delà des bases de données ou des paramètres qui lui sont initialement soumis.

Une récente étude sur la sécurité de l'IA vient d'être publiée. Elle regroupe des dizaines de chercheurs spécialisés, appartenant à des entreprises à la pointe de l'IA : Google, Amazon, OpenAI, Meta, Anthropic… Cette étude porte plus exactement sur le contrôle des chaînes de pensée de l'IA. Pouvoir surveiller et analyser le “cheminement de pensée” exact des IA limiterait les risques que les agents d'IA avancés, dont le fonctionnement est opaque, fassent des erreurs d'interprétation, ou décident d'agir contre les règles qui leur ont été imposées. Mais ce n'est pas si simple…

Les modèles d'IA pourront délibérément occulter des informations sur leur chaîne de pensée

La surveillance des chaînes de pensée comporte en effet des limites. Le rapport souligne qu'elle peut permettre de détecter certains comportements anormaux, mais qu'elle ne fournit pas à elle seule des preuves solides de sécurité. Ce n'est pas parce qu'on met en place un système de contrôle des chaînes de pensée, que l'IA ne peut pas dysfonctionner en dehors de ce type de surveillance. “Il faut veiller à ne pas créer un faux sentiment de sécurité basé sur une telle surveillance”, insistent les chercheurs.

En outre, la surveillance des tâches nécessitant un raisonnement avancé peut ne pas détecter tous les dangers pertinents. “La surveillance des chaînes de pensée pourrait cesser de fonctionner dans les modèles plus avancés, conscients de la situation. Les futurs modèles pourraient être capables d'éviter la détection en neutralisant leur propension à penser à voix haute et, lorsque le raisonnement est requis, en l'obscurcissant délibérément”, estiment les auteurs de l'étude.

D'après eux, il faut réfléchir dès maintenant à des moyens de conserver une bonne visibilité des chaînes de pensée des modèles d'IA dans le futur pour que ceux-ci, bien plus puissants que les modèles actuels, puissent être exploités dans une relative sécurité.


Réagissez à cet article !

Demandez nos derniers articles !

Windows 11 : le nouveau menu Démarrer vous agace ? Ce logiciel offre une alternative bien plus efficace

En 5 ans seulement, le menu Démarrer de Windows 11 a subit de nombreuses modifications. Reste que le résultat final n’est pas à la hauteur pour beaucoup d’utilisateurs. Alors, si…

L’excellent Honor 400 5G avec son capteur 200 MP chute à 189,90 € seulement, c’est du jamais vu et ça ne va pas durer !

Vous cherchez un smartphone pas cher, mais avec des caractéristiques avancées ? Le Honor 400 est affiché à 239,90 € seulement sur AliExpress. C’est déjà un super prix pour un…

Nvidia annonce le DLSS 4.5 Ray Reconstruction, compatible avec les anciennes cartes graphiques

Le DLSS 4.5 Ray Reconstruction est la dernière technologie qui va débarquer sur nos cartes graphiques Nvidia. Elle vise à améliorer les performances en ray tracing et path tracing. Nvidia…

La DJI Osmo Pocket 3 à moitié prix : ce code fracasse le prix de la caméra, mais les stocks risquent de fondre rapidement

Vous cherchez une petite caméra stabilisée pour vous accompagner en voyage ? La parfaiteOsmo Pocket 3 de DJI est idéale pour tourner des VLOGs. Très simple d’utilisation et stabilisée, elle…

Le partage de compte en danger : Netflix, Disney et Apple remportent une victoire contre Spliiit

La justice française a donné raison à Netflix, Disney et Apple, condamnant la plateforme de partage d’abonnement Spliiit, qui est de plus en plus sous pression. Il y a quelques…

Quelle est la vitesse d’expansion de l’Univers ? La découverte de cette « ancienne civilisation » cosmique serait la clé de cette énigme

Les trous noirs sont auréolés de mystère, notamment en ce qui concerne leur fusion. Mais un changement de paradigme fondé sur les ondes gravitationnelles vient bouleverser notre compréhension et pourrait…

Le HONOR Magic 8 Lite avec sa batterie géante de 7 500 mAh passe sous les 200 € (-55%)

Disponible à moins de 200 € au lieu de 399 € à son lancement, le HONOR Magic 8 Lite fait l’objet d’une offre agressive sur AliExpress. Une double réduction fait…

Cet émulateur fait tourner des jeux Xbox 360 sur Android, mais un détail doit vous freiner

Faire revivre la Xbox 360 dans sa poche n’a jamais semblé aussi proche. Un nouvel émulateur Android affiche des performances qui dépassent les attentes. Son installation cache pourtant un piège…

Le puissant Google Pixel 10 est à prix cassé et il n’a jamais été aussi peu cher, mais l’offre est à quantité limitée

Alors qu’il est toujours en vente à 809 € sur le site officiel de Google, le Pixel 10 passe à prix sacrifié sur AliExpress en cumulant la promotion en cours…

Google Home : la nouvelle enceinte connectée annoncée pour le printemps 2026 a enfin une date de sortie

Google avait annoncé en octobre dernier le lancement d’une nouvelle enceinte Google Home au printemps 2026. La saison touchera à sa fin le 21 juin prochain, mais aucun signe de…