L’IA Claude reçoit une nouvelle fonction contre les utilisateurs pénibles (et ça pourrait tout changer)

Anthropic poursuit le développement de Claude, son intelligence artificielle. Après l’avoir dotée d’une nouvelle fonction de mémoire à la demande, l’entreprise se tourne désormais vers un autre aspect : le « bien-être des modèles », en lui permettant de mettre fin à des conversations « pénibles ».

Claude Anthropic IA
Crédits : Anthropic

Les entreprises qui développent des modèles d’intelligence artificielle équipent leurs chatbots de garde-fous et de filtres de contenu, afin d’éviter que leur chatbot ne dérape – comme ça a été le cas plusieurs fois avec Grok, l’IA d’Elon Musk. Concrètement, ces IA sont programmées pour refuser certaines demandes, telles que la création de virus informatiques, d’armes ou de drogue, mais aussi pour esquiver (voire censurer) des sujets jugés sensibles (sexualité, violence, politique…). L’objectif ? Protéger à la fois les utilisateurs et l’entreprise.

Dans certains cas plus extrêmes, les modèles disposent même d’un mécanisme de coupure leur permettant de mettre fin à une conversation. Et c’est précisément de cette nouvelle fonctionnalité qu’Anthropic vient d’équiper son IA, baptisée Claude. Mais cette fois-ci, elle sert un but bien différent.

L’IA Claude peut maintenant interrompre une conversation pour se protéger elle-même

Anthropic continue d’enrichir Claude de nouvelles options, comme une mémoire à la demande, qui permet à l’utilisateur d’instaurer une relation plus maîtrisée avec l’IA. L’entreprise vient en effet d’annoncer une nouvelle fonctionnalité : la capacité pour ses modèles les plus récents, Claude Opus 4 et 4.1, d’interrompre une conversation avec un utilisateur dans « de rares cas extrêmes d’interactions persistantes, nuisibles ou abusives ».

D’après Anthropic, cette fonctionnalité n’interviendra qu’en dernier recours, dans « des cas extrêmes et marginaux », après plusieurs tentatives de redirection vaines ou si l’utilisateur en fait lui-même la demande. Claude ne pourra pas non plus utiliser cette fonction en cas de risque de blessure imminent, qu’il soit pour l’utilisateur lui-même ou pour les autres. Concrètement, l’utilisateur ne pourra plus envoyer de messages dans une conversation si le chatbot a estimé qu’elle était dangereuse (contenu sexuel impliquant des mineurs, actes de violence à grande échelle…). Mais d’après nos confrères d’Engadget, cela n’aura aucune conséquence sur les autres échanges : l’utilisateur pourra créer une autre discussion immédiatement, ou encore retourner dans l’historique de la conversation problématique pour créer de nouvelles branches en modifiant ses réponses.

Mais cette nouveauté n’a pas été créée pour protéger les utilisateurs – ou du moins pas directement –, mais l’IA elle-même. En effet, elle s’inscrit dans le nouveau programme de recherche d’Anthropic, mis en place pour étudier « le bien-être des modèles ». Il s’agit pour le moment d’une expérimentation, et les utilisateurs sont invités à donner leur avis si jamais ils sont confrontés à l’interruption d’une de leurs conversations par Claude.

Réagissez à cet article !

Demandez nos derniers articles !

Cette fuite sur la nouvelle IA de Microsoft a de quoi sérieusement inquiéter

Microsoft vient de lancer un nouvel assistant IA capable d’agir à la place des utilisateurs. Une fuite dévoile pourtant un objectif beaucoup moins reluisant. L’entreprise voudrait volontairement rendre les gens…

IA

Shein condamné à une amende de 22 millions d’euros en France

La DGCCRF a infligé deux sanctions financières à l’encontre de l’entreprise en charge du site de vente en ligne Shein. Que lui reproche l’instance exactement ? On vous explique. La…

Gemini : la fonction Niveau de réflexion est disponible pour tout le monde, mais attention à ne pas en abuser

Avant même que la conférence Google I/O ne commence, la firme de Mountain View nous offrait un avant-goût des nouveautés de Gemini en commençant à déployer une fonctionnalité inédite : Niveau…

IA

Disney+ : voici la liste des nouveaux films et séries à venir en juin 2026

Le mois de juin pointe le bout de son nez et Disney+ en profite pour étoffer son catalogue avec un mélange de grands classiques, d’animation et de séries attendues. De…

Bon plan Redmi Pad 2 : le prix de la tablette chute à nouveau, mais ça ne va pas durer !

Avec la Redmi Pad 2, Xiaomi réussit l’exploit de proposer une tablette puissante à un prix ultra agressif. Normalement en vente à 401 €dans sa version avec 8 Go de…

Le Vivo X300 Ultra est moins bon que le modèle Pro sur un point capital

En temps normal, la version la plus chère d’une série de smartphones est la plus performante à tous les niveaux. Mais pas pour le Vivo X300 Ultra, détrôné par le…

State of Play juin 2026 : Wolverine, God of War, Control Resonant, Tomb Raider, voici le récap’ des grosses annonces PS5

Chose promise, chose due : Sony nous a livré un State of Play à la hauteur des attentes hier soir. Face à l’avalanche d’annonces de gros jeux PS5 et de…

Le Poco M8 Pro 5G est à moitié prix : 185 € pour un smartphone qui n’a rien d’un modèle low cost

Avec son processeur Snapdragon 7s Gen 4, sa batterie de 6 500 mAh et sa charge rapide de 100W, le Poco M8 Pro 5G dispose d’une fiche technique solide pour…

Ce bloc d’alimentation pour PC est si puissant qu’il risque de faire sauter les plombs de votre maison

Chez Asus, la course à la puissance ne connaît plus aucune limite. Sa dernière alimentation pour PC dépasse carrément ce qu’encaisse une prise de courant classique. Votre compteur électrique risque…

Google Discover : quel est ce nouvel onglet qui veut vous détourner des réseaux sociaux ?

Il y a quelques années, la firme de Mountain View a mis en place Discover au sein de son application Google : un flux de contenus personnalisés. Le géant de la…