Cette nouvelle méthode permet aux IA comme DeepSeek de répondre sans censure

Garder le contrôle sur les réponses des intelligences artificielles reste difficile. Une entreprise américaine affirme avoir trouvé un moyen simple pour contourner la censure dans certains modèles. Cette solution pourrait changer la manière d'utiliser l'IA dans les secteurs sensibles.

ia travail employé robot
Crédit : 123rf

L’intelligence artificielle est de plus en plus utilisée dans tous les domaines depuis l'arrivée de ChatGPT. Mais derrière ses prouesses, un problème persiste : certains modèles refusent de répondre à certaines questions jugées sensibles. Cette forme de censure automatique suscite des débats, notamment lorsqu’elle limite des usages professionnels ou éducatifs.

Pour répondre à ce problème, la startup américaine CTGT a développé une nouvelle méthode. Contrairement aux techniques habituelles, elle ne nécessite pas de reprogrammer l’intelligence artificielle ni de la réentraîner pendant des heures. Leur approche consiste à repérer précisément ce qui bloque les réponses dans le modèle, puis à ajuster ces éléments pour rendre l’IA plus libre, sans compromettre sa fiabilité ni sa précision. La société insiste sur le fait que leur système permet de retirer la censure inutile sans ouvrir la porte à des réponses dangereuses, un sujet sensible depuis que des IA comme Grok 3 d’Elon Musk a dérapé à son lancement ou DeepSeek qui a été capable de fournir des guides pour fabriquer des armes chimiques.

CTGT promet de lever la censure des IA sans affecter leur bon fonctionnement

Lors de tests réalisés avec 100 questions sensibles, le modèle DeepSeek de base répondait à peine à 32 % d’entre elles. Après modification avec la méthode de CTGT, il a répondu à 96 % des questions, sans dérapages ni contenus dangereux. Cette technique agit directement lors de l’utilisation de l’IA, ce qui permet de changer son comportement sans toucher à sa programmation d'origine. Le système est aussi réversible : il est possible de désactiver ou d’ajuster les réglages à tout moment.

Cette avancée pourrait intéresser de nombreuses entreprises qui veulent utiliser l’IA tout en respectant leurs propres règles internes. CTGT explique que sa solution évite de lourds investissements en reprogrammation, tout en rendant les modèles plus adaptables à différents usages. Alors que des modèles comme DeepSeek sont vus comme des risques potentiels par les autorités américaines, mieux contrôler ce que cette technologie peut ou ne peut pas dire devient un enjeu crucial dans des secteurs comme la cybersécurité, la finance ou la santé.

Source : CTGT


Réagissez à cet article !

Demandez nos derniers articles !

iOS 26.5 est disponible sur iPhone, voici les nouveautés

Apple a déployé la mise à jour vers la version stable d’iOS 26.5 sur ses iPhone. Elle permet notamment le chiffrement de bout en bout pour les messages RCS avec…

Xiaomi Mix Flip : 900 € de réduction sur cet excellent smartphone pliant, c’est une affaire !

Connaissez-vous le Mix Flip ? C’est le modèle de smartphone pliant de Xiaomi qui concurrence le Z Flip de Samsung. S’il était affiché plus de 1300 euros à sa sortie,…

Redmi Pad 2 Pro : la tablette passe à petit prix avec ce nouveau code !

Les French Days sont derrière, mais les promotions continuent sur AliExpress. Si vous cherchez une tablette polyvalente à prix accessible, la Redmi Pad 2 Pro est actuellement à prix cassé….

Marre des appels de démarchage ? Votre smartphone peut déjà les filtrer, voici comment faire

Comme des millions de Français, vous êtes probablement agacés de recevoir chaque jour des coups de fil de la part des démarcheurs. Et si on vous disait que votre smartphone…

La génération de vidéos par IA va encore passer un cap avec Gemini Omni

Google s’apprête à lancer Gemini Omni, un nouveau modèle de génération de vidéos par IA, qui s’annonce encore plus impressionnant que Veo. Google a grandement amélioré son modèle d’IA de…

IA

Attention, ce vélo électrique vendu chez Lidl présente un défaut qui oblige à cesser de l’utiliser

Un test indépendant a révélé un défaut structurel sur un vélo électrique vendu par Lidl. Le guidon présente des fissures qui pourraient conduire à une rupture brutale. Les propriétaires sont…

Les lunettes connectées deviennent l’outil d’une arnaque qui s’en prend aux femmes

Filmer quelqu’un à son insu dans la rue est devenu un jeu d’enfant avec les lunettes connectées. Certains en ont fait une arnaque, publiant les vidéos avant de réclamer de…

Test Samsung Galaxy Buds4 : ces écouteurs semi-ouverts offrent l’expérience la plus complète du marché, à une condition…

Lorsque Samsung a présenté les Galaxy S26, il a également officialisé sa nouvelle génération d’écouteurs : les Galaxy Buds4. La firme sud-coréenne entend non seulement proposer une expérience complète fidèle…

Une ère se termine chez Tesla avec la production des tout derniers Model S et Model X

Le Model S a inventé la voiture électrique moderne. Le Model X a imposé le luxe zéro émission. Toutes deux viennent d’assembler leurs derniers exemplaires, et leur disparition marque bien…

WhatsApp Plus est disponible sur iPhone, à quel prix et pour quels avantages ?

Meta a commencé à rendre disponible son abonnement WhatsApp Plus sur iPhone en Europe. Voici ce que propose cette offre payante, et à quel prix. L’abonnement payant WhatsApp Plus était…