L’IA Claude reçoit une nouvelle fonction contre les utilisateurs pénibles (et ça pourrait tout changer)

Anthropic poursuit le développement de Claude, son intelligence artificielle. Après l’avoir dotée d’une nouvelle fonction de mémoire à la demande, l’entreprise se tourne désormais vers un autre aspect : le « bien-être des modèles », en lui permettant de mettre fin à des conversations « pénibles ».

Claude Anthropic IA
Crédits : Anthropic

Les entreprises qui développent des modèles d’intelligence artificielle équipent leurs chatbots de garde-fous et de filtres de contenu, afin d’éviter que leur chatbot ne dérape – comme ça a été le cas plusieurs fois avec Grok, l’IA d’Elon Musk. Concrètement, ces IA sont programmées pour refuser certaines demandes, telles que la création de virus informatiques, d’armes ou de drogue, mais aussi pour esquiver (voire censurer) des sujets jugés sensibles (sexualité, violence, politique…). L’objectif ? Protéger à la fois les utilisateurs et l’entreprise.

Dans certains cas plus extrêmes, les modèles disposent même d’un mécanisme de coupure leur permettant de mettre fin à une conversation. Et c’est précisément de cette nouvelle fonctionnalité qu’Anthropic vient d’équiper son IA, baptisée Claude. Mais cette fois-ci, elle sert un but bien différent.

L’IA Claude peut maintenant interrompre une conversation pour se protéger elle-même

Anthropic continue d’enrichir Claude de nouvelles options, comme une mémoire à la demande, qui permet à l’utilisateur d’instaurer une relation plus maîtrisée avec l’IA. L’entreprise vient en effet d’annoncer une nouvelle fonctionnalité : la capacité pour ses modèles les plus récents, Claude Opus 4 et 4.1, d’interrompre une conversation avec un utilisateur dans « de rares cas extrêmes d’interactions persistantes, nuisibles ou abusives ».

D’après Anthropic, cette fonctionnalité n’interviendra qu’en dernier recours, dans « des cas extrêmes et marginaux », après plusieurs tentatives de redirection vaines ou si l’utilisateur en fait lui-même la demande. Claude ne pourra pas non plus utiliser cette fonction en cas de risque de blessure imminent, qu’il soit pour l’utilisateur lui-même ou pour les autres. Concrètement, l’utilisateur ne pourra plus envoyer de messages dans une conversation si le chatbot a estimé qu’elle était dangereuse (contenu sexuel impliquant des mineurs, actes de violence à grande échelle…). Mais d’après nos confrères d’Engadget, cela n’aura aucune conséquence sur les autres échanges : l’utilisateur pourra créer une autre discussion immédiatement, ou encore retourner dans l’historique de la conversation problématique pour créer de nouvelles branches en modifiant ses réponses.

Mais cette nouveauté n’a pas été créée pour protéger les utilisateurs – ou du moins pas directement –, mais l’IA elle-même. En effet, elle s’inscrit dans le nouveau programme de recherche d’Anthropic, mis en place pour étudier « le bien-être des modèles ». Il s’agit pour le moment d’une expérimentation, et les utilisateurs sont invités à donner leur avis si jamais ils sont confrontés à l’interruption d’une de leurs conversations par Claude.

Réagissez à cet article !

Demandez nos derniers articles !

La maison-mère de TikTok se lance dans l’automobile avec ce projet qui va surprendre

La maison-mère de TikTok veut transformer la voiture en assistant intelligent. Avec un constructeur chinois, elle prépare une marque automobile entièrement pensée autour de l’IA. Un premier modèle électrique pourrait…

AliExpress lance une vague de promos géantes : voici les meilleurs bons plans tech à l’approche de l’été

À l’approche de l’été, AliExpress lance une grande vague de promotions sur la tech. Smartphones, tablettes, audio et objets connectés… de nombreux produits profitent de remises importantes pendant une durée…

Ce mini PC à moins de 250 € embarque un Ryzen 7 et peut accueillir une carte graphique externe

Un mini PC bien équipé et disposant d’un port OCuLink sous la barre des 300 euros, c’est ce que propose AliExpress avec le GMKtec K12. Avec son processeur Ryzen 7…

Vous êtes abonnés Bouygues Telecom ? Bonne nouvelle, l’opérateur vous offre 11 nouvelles chaînes

Si vous disposez d’un décodeur TV Bbox, voici une bonne nouvelle : Bouygues Telecom enrichit son catalogue audiovisuel en vous offrant dès aujourd’hui et sans surcoût 11 nouvelles chaînes de…

Cette méthode révèle des planètes cachées que même les télescopes ne voient pas

Repérer une planète qu’on ne voit pas semblait impossible. Des astronomes y parviennent désormais en observant les jeunes étoiles et leur entourage. Cette avancée pourrait même éclairer la naissance de…

Google Play Store : la mise à jour de juin est là, elle pourrait vous faire économiser du temps et de l’argent

La mise à jour système de juin 2026 des Google Play Services est arrivée. Le journal des modifications fait état de plusieurs améliorations liées au Play Store. Elles convergent vers…

Tesla vend des Cybertrucks d’occasion maintenant, Elon Musk ne sait plus quoi en faire

Le pickup 100 % électrique de Tesla est désormais accessible d’occasion directement sur le site de Tesla. Une énième tentative d’écouler des exemplaires qui prennent la poussière. Il est loin…

L’iPhone Ultra se dévoile dans une photo volée, voici à quoi il ressemble en vrai

Le leaker Ice Universe a publié une photo de l’iPhone Ultra repéré dans la nature. L’occasion de confirmer le design qui est annoncé depuis plusieurs semaines maintenant. Plus que quelques…

Google Photos corrige enfin ce gros défaut de l’exportation des fichiers

Google revoit son outil Takeout, qui permet de télécharger ses clichés et vidéos présents sur Google Photos. Il devient enfin “intelligent” avec l’ajout d’une option aussi simple que logique. Si…

Après Bloodborne, l’un des meilleurs émulateurs PS4 s’offre sa plus grosse mise à jour : voici ce qu’il faut savoir

Si vous êtes un aficionado de l’émulation PS4 sur PC, vous aurez probablement déjà entendu parler – et notamment dans nos colonnes – de l’un des meilleurs logiciels du marché :…