Cette nouvelle méthode permet aux IA comme DeepSeek de répondre sans censure

Garder le contrôle sur les réponses des intelligences artificielles reste difficile. Une entreprise américaine affirme avoir trouvé un moyen simple pour contourner la censure dans certains modèles. Cette solution pourrait changer la manière d'utiliser l'IA dans les secteurs sensibles.

ia travail employé robot
Crédit : 123rf

L’intelligence artificielle est de plus en plus utilisée dans tous les domaines depuis l'arrivée de ChatGPT. Mais derrière ses prouesses, un problème persiste : certains modèles refusent de répondre à certaines questions jugées sensibles. Cette forme de censure automatique suscite des débats, notamment lorsqu’elle limite des usages professionnels ou éducatifs.

Pour répondre à ce problème, la startup américaine CTGT a développé une nouvelle méthode. Contrairement aux techniques habituelles, elle ne nécessite pas de reprogrammer l’intelligence artificielle ni de la réentraîner pendant des heures. Leur approche consiste à repérer précisément ce qui bloque les réponses dans le modèle, puis à ajuster ces éléments pour rendre l’IA plus libre, sans compromettre sa fiabilité ni sa précision. La société insiste sur le fait que leur système permet de retirer la censure inutile sans ouvrir la porte à des réponses dangereuses, un sujet sensible depuis que des IA comme Grok 3 d’Elon Musk a dérapé à son lancement ou DeepSeek qui a été capable de fournir des guides pour fabriquer des armes chimiques.

CTGT promet de lever la censure des IA sans affecter leur bon fonctionnement

Lors de tests réalisés avec 100 questions sensibles, le modèle DeepSeek de base répondait à peine à 32 % d’entre elles. Après modification avec la méthode de CTGT, il a répondu à 96 % des questions, sans dérapages ni contenus dangereux. Cette technique agit directement lors de l’utilisation de l’IA, ce qui permet de changer son comportement sans toucher à sa programmation d'origine. Le système est aussi réversible : il est possible de désactiver ou d’ajuster les réglages à tout moment.

Cette avancée pourrait intéresser de nombreuses entreprises qui veulent utiliser l’IA tout en respectant leurs propres règles internes. CTGT explique que sa solution évite de lourds investissements en reprogrammation, tout en rendant les modèles plus adaptables à différents usages. Alors que des modèles comme DeepSeek sont vus comme des risques potentiels par les autorités américaines, mieux contrôler ce que cette technologie peut ou ne peut pas dire devient un enjeu crucial dans des secteurs comme la cybersécurité, la finance ou la santé.

Source : CTGT


Réagissez à cet article !

Demandez nos derniers articles !

Appels indésirables incessants : cette solution efficace est proposée par NordVPN !

Tout le monde connaît NordVPN, le service VPN le plus avancé et le plus complet du marché. Mais cette solution pour sécuriser votre vie en ligne vient de dévoiler un…

Combien d’emplois ont été perdus à cause de l’IA ? Cet outil nous donne la réponse

Face aux inquiétudes concernant les conséquences de l’IA sur le marché du travail, la Californie a mis en ligne un outil de suivi des pertes d’emploi directement liées à cette…

The Frame 4K QLED (2026) de 55 pouces : à peine sortie, Samsung brade déjà son excellente TV pour les Soldes !

Les Soldes ont commencé sur Samsung et cette année encore, le géant coréen ne fait pas les choses à moitié. Sortie récemment, la nouvelle The Frame 4K QLED de 55…

Canicule : des élèves de Paris accueillis dans les locaux climatisés de Google France

La branche française de Google a accepté d’accueillir des classes d’écoles parisiennes au sein de son siège pour qu’ils puissent être au frais en cette période de canicule. De très…

Les arnaques aux fausses pharmacies en ligne sévissent de plus belle en France

Pharmafraud est un type d’arnaque visant à imiter des pharmacies en ligne pour voler les données personnelles et bancaires des utilisateurs. Les escrocs utilisent des médicaments populaires comme le Viagra…

Shark ChillPill : le ventilateur brumisateur portable passe à prix cassé pour les soldes, mais les stocks sont bientôt épuisés !

Vous cherchez un petit ventilateur brumisateur portable pour supporter les fortes chaleurs ? Le Shark ChillPill est un modèle puissant qui vous permet d’abaisser la température ressentie de 9 degrés…

GTA 6 va peser une tonne, voici comment gagner de la place sur votre PS5 ou Xbox Series

GTA 6 va peser dans l’histoire du jeu vidéo… Et ce, dans tous les sens du terme. En effet, il y a fort à parier que le titre de Rockstar…

Netflix complique encore le partage de compte avec cette nouvelle contrainte

Netflix exige désormais que chaque utilisateur d’un compte partagé fournisse son adresse email. Chaque profil du compte doit donc être associé à un email. En 2023, Netflix mettait fin au…

Test Xiaomi 17T : ce smartphone est-il seulement le « maître du téléobjectif » autoproclamé ?

Moins d’un an après la sortie du Xiaomi 15T, il est déjà temps d’accueillir son successeur : le Xiaomi 17T. Plus compact que son prédécesseur, il est aussi une version « allégée »…

Dreame L40s Pro Ultra : avec cette grosse chute de prix, l’aspirateur robot devient plus abordable !

Vous cherchez un aspirateur robot à double serpillère qui reste accessible en termes de prix ? Pour ce dernier jour du Prime Day, Amazon affiche une très belle promotion sur…