ChatGPT et Gemini sont vulnérables à une nouvelle forme de manipulation

Les réponses de ChatGPT et Gemini ne sont pas toujours fiables. Une faille permettrait de les influencer plus facilement que prévu. Les experts alertent sur des dérives déjà bien réelles.

ChatGPT fonction mémoire
Source : Adobe Stock

Les menaces liées à l’intelligence artificielle ne cessent de progresser. Ces dernières années, les outils basés sur l’IA ont été largement exploités pour automatiser des attaques informatiques. Selon une étude du MIT Sloan et de Safe Security, près de 80 % des ransomwares récents reposent déjà sur ces technologies. Cette évolution permet aux pirates de gagner du temps et d’augmenter l’efficacité de leurs opérations.

Dans le même temps, plusieurs chercheurs ont montré que les IA comme ChatGPT ou Gemini restent faciles à manipuler. Des techniques simples permettent de contourner leurs protections et de générer des contenus dangereux. Certaines méthodes exploitent des scénarios fictifs ou des instructions détournées pour tromper les modèles. Ces outils peuvent produire des informations trompeuses sans détecter le problème.

Une technique appelée GEO permet d’influencer les réponses de ChatGPT et Gemini avec de simples blogs

Une nouvelle méthode inquiète désormais les spécialistes. D’après BGR, une technique appelée Generative Engine Optimization (GEO) permet de manipuler facilement les réponses des chatbots. Elle consiste à publier des articles de blog optimisés pour influencer les sources utilisées par les IA. Ces contenus peuvent ensuite apparaître dans les réponses générées, même s’ils sont biaisés ou inexacts.

Le problème vient du fonctionnement même des modèles. Lorsqu’ils manquent d’informations fiables sur un sujet précis, ils s’appuient sur des contenus récents trouvés en ligne. Ces “zones vides” d’information sont alors comblées par des sources peu fiables. Une étude de la société Ahrefs indique que ChatGPT s’appuie sur des blogs dans environ 67 % des cas, dont une partie provient de sites peu crédibles. La fraîcheur du contenu compte souvent plus que sa fiabilité.

Les risques sont nombreux. Cette méthode peut servir à promouvoir des produits, manipuler l’opinion ou diffuser de fausses informations. Des campagnes peuvent même viser la santé, la finance ou la réputation de certaines personnes. Le phénomène rappelle le SEO utilisé pour les moteurs de recherche, mais avec un impact potentiellement plus direct. De plus en plus d’entreprises cherchent déjà à exploiter cette faille pour apparaître dans les réponses des IA.

Face à cette situation, les grandes entreprises du secteur travaillent sur des solutions. Mais le problème reste difficile à corriger sans limiter les capacités des modèles. En attendant, les experts recommandent de rester vigilant et de vérifier les sources. Les utilisateurs ont tendance à faire confiance aux réponses des IA, parfois sans consulter les liens proposés. Cette dépendance renforce l’impact de ces manipulations.


Réagissez à cet article !

Demandez nos derniers articles !

L’iPhone 16e peut corriger son plus gros défaut pour environ 20 euros

Vous hésitez à passer de l’iPhone 16e à l’iPhone 17e juste pour profiter d’une amélioration majeure qui lui est exclusive ? Attendez, il est théoriquement possible de le faire sans…

Google Pixel : la mise à jour de mars casse (encore !) l’affichage permanent

Il est indispensable d’installer les mises à jour les plus récentes dès qu’elles sont disponibles afin de préserver la sécurité de son appareil. Mais l’on peut comprendre que ce soit…

“Étape 6” : grosse panne en cours chez Free, les box Internet ne veulent plus se connecter

Une panne frappe les services Internet de Free ce matin, empêchant les utilisateurs de se connecter au réseau. Les box sont toutes bloquées à “l’étape 6”, privant d’un accès au…

Lors d’un procès, il témoigne en répétant les réponses reçues via ses lunettes connectées

Un homme appelé à témoigner pendant un procès se faisait conseiller en direct et à distance à travers ses lunettes connectées. Son stratagème a été découvert et la juge n’a…

Firefox va enfin avoir droit à son propre VPN gratuit, mais attention à ne pas être trop gourmand

Mozilla vient d’annoncer les nouveautés qui intégreront la prochaine mouture de Firefox et l’une d’entre elles a retenu l’attention de tout le monde. Et pour cause : le navigateur va…

Google : le mode Personal Intelligence qui booste vos résultats de recherche devrait bientôt arriver en France

Google étend l’accès à son mode Personal Intelligence, capable de s’appuyer sur vos données personnelles pour proposer de meilleurs résultats de recherche. Tous les utilisateurs, abonnés payants ou non, y…

IA

La NASA veut envoyer des astronautes vers la Lune à un rythme jamais vu

La NASA peine encore à renvoyer des astronautes sur la Lune. Pourtant, elle annonce déjà un objectif beaucoup plus ambitieux. Le rythme des missions pourrait radicalement changer, voire exploser, dès…

Spotify : profitez dès maintenant de l’expérience d’écoute la plus pure possible grâce à cette option inédite

Avis aux amateurs de musique, Spotify lance une nouvelle option qui va vous permettre de profiter de la meilleure expérience d’écoute possible : le mode exclusif. On vous explique en…

DLSS 5 : Internet se lâche et se moque ouvertement de Nvidia, notre sélection des meilleures blagues

La présentation du DLSS 5 ne s’est pas exactement passée comme prévu pour Nvidia : au lieu d’être ébahi devant les visuels générés par IA, Internet a majoritairement détesté le…

Apple active en silence un nouveau système de sécurité sur ses appareils

Apple introduit un changement discret qui passe inaperçu pour la plupart des utilisateurs. Pourtant, ce nouveau mécanisme agit directement au cœur de la sécurité des appareils. Cette protection invisible est…