L’IA Claude reçoit une nouvelle fonction contre les utilisateurs pénibles (et ça pourrait tout changer)

Anthropic poursuit le développement de Claude, son intelligence artificielle. Après l’avoir dotée d’une nouvelle fonction de mémoire à la demande, l’entreprise se tourne désormais vers un autre aspect : le « bien-être des modèles », en lui permettant de mettre fin à des conversations « pénibles ».

Claude Anthropic IA
Crédits : Anthropic

Les entreprises qui développent des modèles d’intelligence artificielle équipent leurs chatbots de garde-fous et de filtres de contenu, afin d’éviter que leur chatbot ne dérape – comme ça a été le cas plusieurs fois avec Grok, l’IA d’Elon Musk. Concrètement, ces IA sont programmées pour refuser certaines demandes, telles que la création de virus informatiques, d’armes ou de drogue, mais aussi pour esquiver (voire censurer) des sujets jugés sensibles (sexualité, violence, politique…). L’objectif ? Protéger à la fois les utilisateurs et l’entreprise.

Dans certains cas plus extrêmes, les modèles disposent même d’un mécanisme de coupure leur permettant de mettre fin à une conversation. Et c’est précisément de cette nouvelle fonctionnalité qu’Anthropic vient d’équiper son IA, baptisée Claude. Mais cette fois-ci, elle sert un but bien différent.

L’IA Claude peut maintenant interrompre une conversation pour se protéger elle-même

Anthropic continue d’enrichir Claude de nouvelles options, comme une mémoire à la demande, qui permet à l’utilisateur d’instaurer une relation plus maîtrisée avec l’IA. L’entreprise vient en effet d’annoncer une nouvelle fonctionnalité : la capacité pour ses modèles les plus récents, Claude Opus 4 et 4.1, d’interrompre une conversation avec un utilisateur dans « de rares cas extrêmes d’interactions persistantes, nuisibles ou abusives ».

D’après Anthropic, cette fonctionnalité n’interviendra qu’en dernier recours, dans « des cas extrêmes et marginaux », après plusieurs tentatives de redirection vaines ou si l’utilisateur en fait lui-même la demande. Claude ne pourra pas non plus utiliser cette fonction en cas de risque de blessure imminent, qu’il soit pour l’utilisateur lui-même ou pour les autres. Concrètement, l’utilisateur ne pourra plus envoyer de messages dans une conversation si le chatbot a estimé qu’elle était dangereuse (contenu sexuel impliquant des mineurs, actes de violence à grande échelle…). Mais d’après nos confrères d’Engadget, cela n’aura aucune conséquence sur les autres échanges : l’utilisateur pourra créer une autre discussion immédiatement, ou encore retourner dans l’historique de la conversation problématique pour créer de nouvelles branches en modifiant ses réponses.

Mais cette nouveauté n’a pas été créée pour protéger les utilisateurs – ou du moins pas directement –, mais l’IA elle-même. En effet, elle s’inscrit dans le nouveau programme de recherche d’Anthropic, mis en place pour étudier « le bien-être des modèles ». Il s’agit pour le moment d’une expérimentation, et les utilisateurs sont invités à donner leur avis si jamais ils sont confrontés à l’interruption d’une de leurs conversations par Claude.

Réagissez à cet article !

Demandez nos derniers articles !

Économisez 376 € sur le Xiaomi 17 : cette offre imbattable se termine bientôt !

Lancé tout récemment en Europe, le Xiaomi 17 est déjà en promotion. La version 512 Go profite d’une réduction de près de 380 €, mais cette offre se termine bientôt….

Windows 11 : ce petit outil n’a l’air de rien, mais il corrige enfin l’un des pires défauts du système

Même après des années, voire des décennies d’expérience sur Windows, il n’est pas rare de se perdre dans ses menus, tant ces derniers sont obstrués par des options inutiles. Alors,…

Le commandant d’Artemis 2 est catégorique, atterrir sur la Lune est faisable et c’est pour bientôt

De retour sur Terre depuis moins d’une semaine, l’équipage d’Artemis 2 est déjà de retour au travail. Reid Wiseman, le commandant de la mission, a livré une conviction forte sur…

Plus de 20 procès et 14 milliards en jeu, Tesla n’a jamais été aussi menacé par la justice

Tesla se retrouve face à plus de 20 fronts judiciaires simultanés aux États-Unis. Les montants en jeu pourraient atteindre 14,5 milliards de dollars. Et selon une analyse détaillée, le pire…

Jusqu’à 150 € d’économie sur le Galaxy A57 : Samsung met le paquet pour le lancement

Le Galaxy A57 vient à peine de sortir qu’il bénéficie déjà d’une réduction intéressante. 120 € de remise sur la version 256 Go et 30 € de bonus reprise, en…

La moto électrique la plus avancée du monde est refroidie par… un vulgaire ventilateur de PC

La Verge TS Pro Gen2 vient de dévoiler les secrets de sa batterie à état solide. Cette moto se recharge de 10 à 80 % en 11 minutes et affiche…

La première vraie bande-annonce d’Avengers Doomsday est riche en révélations

Avengers Doomsday a enfin droit à une véritable bande-annonce, qui n’est pas avare en détails intéressants. Voici ce qu’on en retient.  Le CinemaCon, grand rassemblement mondial de l’industrie cinématographique réunissant…

GTA 6 : retour des 6 étoiles, saluer ou provoquer… Un fan compile toutes les fuites dans une liste titanesque

Alors qu’il n’est même pas encore sorti, GTA 6 est déjà un véritable phénomène mondial : c’est sans conteste le jeu le plus attendu de l’année 2026. Puisqu’il n’y a rien…

Poco M8 5G : avec 110 € de réduction, ce smartphone performant avec un superbe écran AMOLED incurvé passe à prix mini !

Le Poco M8 5G bénéficie en ce moment d’une double réduction sur AliExpress. Le smartphone voit ainsi son prix chuter à moins de 165 euros. C’est un excellent prix pour…

Toujours plus : ce nouveau smartphone Android est attendu avec une batterie massive de 8 000 mAh

L’Oppo Find X10 devrait conserver un format relativement compact, ce qui ne l’empêchera pas d’embarquer une batterie à très forte capacité. Plus que quelques jours à attendre avant le lancement…