L’IA Claude reçoit une nouvelle fonction contre les utilisateurs pénibles (et ça pourrait tout changer)

Par Céline Demoineret Le 18/08/2025 0 com

Anthropic poursuit le développement de Claude, son intelligence artificielle. Après l’avoir dotée d’une nouvelle fonction de mémoire à la demande, l’entreprise se tourne désormais vers un autre aspect : le « bien-être des modèles », en lui permettant de mettre fin à des conversations « pénibles ».

Claude Anthropic IA — Crédits : Anthropic

Les entreprises qui développent des modèles d’intelligence artificielle équipent leurs chatbots de garde-fous et de filtres de contenu, afin d’éviter que leur chatbot ne dérape – comme ça a été le cas plusieurs fois avec Grok, l’IA d’Elon Musk. Concrètement, ces IA sont programmées pour refuser certaines demandes, telles que la création de virus informatiques, d’armes ou de drogue, mais aussi pour esquiver (voire censurer) des sujets jugés sensibles (sexualité, violence, politique…). L’objectif ? Protéger à la fois les utilisateurs et l’entreprise.

Dans certains cas plus extrêmes, les modèles disposent même d’un mécanisme de coupure leur permettant de mettre fin à une conversation. Et c’est précisément de cette nouvelle fonctionnalité qu’Anthropic vient d’équiper son IA, baptisée Claude. Mais cette fois-ci, elle sert un but bien différent.

L’IA Claude peut maintenant interrompre une conversation pour se protéger elle-même

Anthropic continue d’enrichir Claude de nouvelles options, comme une mémoire à la demande, qui permet à l’utilisateur d’instaurer une relation plus maîtrisée avec l’IA. L’entreprise vient en effet d’annoncer une nouvelle fonctionnalité : la capacité pour ses modèles les plus récents, Claude Opus 4 et 4.1, d’interrompre une conversation avec un utilisateur dans « de rares cas extrêmes d’interactions persistantes, nuisibles ou abusives ».

D’après Anthropic, cette fonctionnalité n’interviendra qu’en dernier recours, dans « des cas extrêmes et marginaux », après plusieurs tentatives de redirection vaines ou si l’utilisateur en fait lui-même la demande. Claude ne pourra pas non plus utiliser cette fonction en cas de risque de blessure imminent, qu’il soit pour l’utilisateur lui-même ou pour les autres. Concrètement, l’utilisateur ne pourra plus envoyer de messages dans une conversation si le chatbot a estimé qu’elle était dangereuse (contenu sexuel impliquant des mineurs, actes de violence à grande échelle…). Mais d’après nos confrères d’Engadget, cela n’aura aucune conséquence sur les autres échanges : l’utilisateur pourra créer une autre discussion immédiatement, ou encore retourner dans l’historique de la conversation problématique pour créer de nouvelles branches en modifiant ses réponses.

Mais cette nouveauté n’a pas été créée pour protéger les utilisateurs – ou du moins pas directement –, mais l’IA elle-même. En effet, elle s’inscrit dans le nouveau programme de recherche d’Anthropic, mis en place pour étudier « le bien-être des modèles ». Il s’agit pour le moment d’une expérimentation, et les utilisateurs sont invités à donner leur avis si jamais ils sont confrontés à l’interruption d’une de leurs conversations par Claude.

Abonnez-vous gratuitement à la newsletter

Réagissez à cet article !

Voir tous les commentaires

Demandez nos derniers articles !

Galaxy Buds3 Pro : les excellents écouteurs de Samsung sont à prix cassé avec ces 2 offres cumulables !
Vous cherchez de bons écouteurs avec une réduction de bruit efficace mais à prix accessible ? Normalement en vente à 199 €, les Samsung Galaxy Buds3 Pro passent à seulement 99 € en cumulant l’offre de remboursement de 50 €…

Bons plans 30/12/2025
Stranger Things saison 5 : la bande-annonce du dernier épisode dévoilée, voici ce qu’elle nous apprend
Le coup d’envoi est donné : le 1er janvier 2026 marquera la fin de Stranger Things, l’une des séries les plus populaires de la décennie. En attendant que l’ultime épisode soit diffusé, Netflix en dévoile la bande-annonce. Plus que quelques…

Netflix 30/12/2025
Test TECNO Megabook K15S : un PC portable puissant, fin et abordable !
Si TECNO est une marque d’ordinateurs portables récemment arrivée en France, elle mérite le détour par son catalogue riche en modèles. Malgré des prix agressifs, la marque ne fait aucun sacrifice sur le design et la qualité de fabrication. Le…

Tests 30/12/2025
Tesla Model 3 vs Ford Mustang Dark Horse : voici le vainqueur (le verdict final bouscule les pronostics)
Si on vous dit qu’une Tesla Model 3 Performance affronte une Ford Mustang Dark Horse dotée d’un compresseur, vous pourriez avoir tendance à miser sur la thermique plutôt que sur l’électrique. Une vidéo YouTube révèle les résultats de ce duel…

Voitures électriques 30/12/2025
Galaxy S26 et S26 Ultra : une vidéo dévoile le design final des futurs smartphones de Samsung
La prochaine gamme de smartphones Galaxy S26 devrait être officiellement présentée par Samsung en février 2026. Elle n’a pourtant déjà plus beaucoup de secrets pour les internautes qui s’y intéressent. Mais les leakers parviennent encore à nous surprendre : l’un…

Samsung 30/12/2025
La PS6 et la prochaine Xbox pourraient sortir plus tard que prévu pour éviter qu’elles coûtent un rein
On n’a pas encore fini parler de la crise de la RAM et cette fois, ce sont les constructeurs de consoles qui s’inquiètent des mois à venir. Un récent rapport indique en effet que la sortie de la PS6 et…

Consoles et hardware 30/12/2025
Avengers Doomsday : on sait quand le premier trailer sera diffusé, un peu de patience
Il semblerait que la date de diffusion de la première bande-Annonce d’Avengers : Doomsday ait fuité. Si la rumeur qui circule est exacte, nous ne sommes plus qu’à quelques semaines d’avoir enfin uyn vrai aperçu du film le plus attendu…

Streaming 30/12/2025
Tineco Floor One S5 Stretch Extreme : l’aspirateur laveur de sol chute à moins de 250 €, vite !
Et si vous commenciez l’année avec un intérieur propre comme par magie ? Avec le Tineco Floor One S5 Stretch Extreme, la corvée du nettoyage des sols est finie. Et bonne nouvelle, cet excellent aspirateur laveur va vous faciliter la…

Bons plans 30/12/2025
Dyson V15 Origin : vite, avec ces 250 € de réduction, cet excellent aspirateur sans fil devient abordable !
Le secteur des aspirateurs sans fil est énorme avec des différences de prix colossales entre les meilleurs modèles et ceux bas de gamme. Si vous voulez acheter l’un des meilleurs aspirateurs sans fil sans vous ruiner, nous avons trouvé une…

Bons plans 30/12/2025
Samsung prépare une batterie titanesque pour ses smartphones Galaxy, mais il y a un sérieux problème
Samsung est régulièrement critiqué pour la capacité de ses batteries bien en-deçà des performances offertes par les fabricants de smartphones chinois. Qu’à cela ne tienne, la firme sud-coréenne développerait une batterie à double cellule impressionnante. L’un des principaux critères sur…

Samsung 30/12/2025

Newsletter