Cette nouvelle méthode permet aux IA comme DeepSeek de répondre sans censure

Garder le contrôle sur les réponses des intelligences artificielles reste difficile. Une entreprise américaine affirme avoir trouvé un moyen simple pour contourner la censure dans certains modèles. Cette solution pourrait changer la manière d'utiliser l'IA dans les secteurs sensibles.

ia travail employé robot
Crédit : 123rf

L’intelligence artificielle est de plus en plus utilisée dans tous les domaines depuis l'arrivée de ChatGPT. Mais derrière ses prouesses, un problème persiste : certains modèles refusent de répondre à certaines questions jugées sensibles. Cette forme de censure automatique suscite des débats, notamment lorsqu’elle limite des usages professionnels ou éducatifs.

Pour répondre à ce problème, la startup américaine CTGT a développé une nouvelle méthode. Contrairement aux techniques habituelles, elle ne nécessite pas de reprogrammer l’intelligence artificielle ni de la réentraîner pendant des heures. Leur approche consiste à repérer précisément ce qui bloque les réponses dans le modèle, puis à ajuster ces éléments pour rendre l’IA plus libre, sans compromettre sa fiabilité ni sa précision. La société insiste sur le fait que leur système permet de retirer la censure inutile sans ouvrir la porte à des réponses dangereuses, un sujet sensible depuis que des IA comme Grok 3 d’Elon Musk a dérapé à son lancement ou DeepSeek qui a été capable de fournir des guides pour fabriquer des armes chimiques.

CTGT promet de lever la censure des IA sans affecter leur bon fonctionnement

Lors de tests réalisés avec 100 questions sensibles, le modèle DeepSeek de base répondait à peine à 32 % d’entre elles. Après modification avec la méthode de CTGT, il a répondu à 96 % des questions, sans dérapages ni contenus dangereux. Cette technique agit directement lors de l’utilisation de l’IA, ce qui permet de changer son comportement sans toucher à sa programmation d'origine. Le système est aussi réversible : il est possible de désactiver ou d’ajuster les réglages à tout moment.

Cette avancée pourrait intéresser de nombreuses entreprises qui veulent utiliser l’IA tout en respectant leurs propres règles internes. CTGT explique que sa solution évite de lourds investissements en reprogrammation, tout en rendant les modèles plus adaptables à différents usages. Alors que des modèles comme DeepSeek sont vus comme des risques potentiels par les autorités américaines, mieux contrôler ce que cette technologie peut ou ne peut pas dire devient un enjeu crucial dans des secteurs comme la cybersécurité, la finance ou la santé.

Source : CTGT


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Ne demandez pas à ChatGPT de générer vos mots de passe

Utiliser un chatbot pour créer vos mots de passe, c’est pratique non ? Peut-être, mais d’après ces experts, vous devriez arrêter de le faire. Il s’avère que l’IA n’est pas…

Galaxy S26, S26+ et S26 Ultra moins chers : où les acheter au meilleur prix ?

Les Galaxy S26, S26+ et S26 Ultra sont disponibles à la précommande. Samsung et ses partenaires proposent une offre de lancement qui permet de les acheter moins cher, pendant quelques…

Vous commandez sur Shein, Aliexpress ou Temu ? Attention : vous allez bientôt payer plus cher

Une taxe souhaitée par le gouvernement va entrer en vigueur dans peu de temps. Elle impacte vos commandes sur Temu, Shein ou Aliexpress et peut rapidement faire grimper la facture…

Les Galaxy S26 sont capables de trouver le moment exact de la vidéo que vous cherchez grâce à l’IA

Il n’est pas toujours facile de savoir dans quelle vidéo se trouve ce moment hilarant que vous souhaitez montrer à un proche et les Galaxy S26 comptent bien régler ce…

Gemini devient encore plus intelligent avec ces nouvelles fonctionnalités

En parallèle de la sortie des Galaxy S26, Google annonce les nouveautés de son IA Gemini. Elle devient capable de faire encore plus de choses à votre place. De quoi…

IA

Adobe Firefly vous fait gagner un temps fou sur le montage vidéo grâce à sa nouvelle fonction IA

Le montage vidéo prend souvent des heures, même pour des projets simples. Adobe veut accélérer cette étape grâce à l’intelligence artificielle. Une nouvelle fonction de Firefly promet de créer un…

IA

Outlook : Microsoft a trouvé un nouveau moyen hyper intrusif de vous forcer à utiliser son IA Copilot

Microsoft veut absolument que vous aimiez son IA Copilot et compte bien pour cela vous forcer à l’utiliser contre votre gré. D’ici quelques mois à peine, une nouvelle fonctionnalité d’Outlook…

Les patrons de Disney ont vu Avengers Doomsday, voici ce qu’ils en ont pensé

La sortie d’Avengers Doomsday approche. En attendant, des personnes haut placées chez Disney ont pu voir à quoi ressemble le film. Leur avis est-il rassurant ou inquiétant ? 7 ans…

ChatGPT va proposer une offre à 100 dollars par mois, pour ceux qui sont limités par la version Plus

Du code déniché dans la version web de ChatGPT laisse entendre qu’une nouvelle formule d’abonnement est sur le point d’arriver. Baptisée “Pro Lite”, celle-ci devrait se positionner entre les formules…

IA

Des publicités Google piégées échappent aux contrôles grâce à cet outil pirate

Les publicités en ligne sont devenues un terrain de jeu pour les cybercriminels. Certains outils permettent désormais de contourner les systèmes de vérification des grandes plateformes. Une nouvelle menace vise…