Cette IA populaire se déguise en navigateur pour contourner les blocages et aspirer le web en cachette

Un moteur de réponses dopé à l’IA est accusé d’ignorer les règles des sites web. Il utiliserait des méthodes cachées pour contourner les blocages automatisés.

Robots IA
Crédits : 123RF

Depuis l’arrivée des outils d’intelligence artificielle grand public, les robots d’indexation se sont multipliés sur le web. ChatGPT, par exemple, traite plus de 2,5 milliards de requêtes par jour dans le monde, une croissance fulgurante qui pousse ces programmes à explorer toujours plus de contenus. Pour y parvenir, ces systèmes reposent sur des bots qui scannent automatiquement des millions de pages. En principe, ces robots doivent respecter les règles des sites web, notamment les fichiers robots.txt, qui indiquent ce qui peut être consulté ou non. Mais selon un rapport récent, l’IA Perplexity ignorerait volontairement ces restrictions.

Déjà en 2024, Cloudflare alertait sur l’explosion du trafic généré par les bots d’IA, dans son rapport annuel sur les tendances web. L’entreprise évoquait un écosystème de plus en plus saturé, entre bots déclarés comme ClaudeBot ou GPTBot, et d’autres, beaucoup plus discrets, aux pratiques floues.

Perplexity accède aux sites bloqués grâce à un robot déguisé en navigateur Chrome

Aujourd’hui, une nouvelle étude menée par Cloudflare cible directement Perplexity, un moteur de réponses propulsé par l’IA. Selon les chercheurs, ce service commencerait par utiliser son robot officiel pour accéder aux sites. Mais dès qu’un blocage est détecté, il changerait de stratégie en utilisant un robot déguisé, qui se fait passer pour un navigateur classique comme Google Chrome sur macOS. Pire encore, ces tentatives ne s’identifient plus du tout comme venant de l’IA, contournant ainsi les protections prévues.

L’étude révèle que Perplexity modifie son adresse IP, son identifiant utilisateur (user-agent) et même son fournisseur réseau pour tromper les systèmes de sécurité. Ces robots dissimulés ont été observés sur des milliers de sites, générant jusqu’à 6 millions de requêtes par jour. Des tests réalisés sur des pages secrètes et non indexées ont montré que Perplexity pouvait quand même en restituer le contenu. Ce comportement va à l’encontre des normes définies par Internet pour les robots automatisés.

À l’inverse, des entreprises comme OpenAI suivent des pratiques transparentes : leurs robots respectent les consignes, s’identifient clairement, et s’arrêtent dès qu’un site leur interdit l’accès. Ce type de comportement est crucial pour préserver la confiance sur le web. Face aux méthodes plus opaques de certains acteurs, des solutions existent : les sites peuvent bloquer les bots non déclarés ou exiger une vérification. Mais cette course à la discrétion risque de s’intensifier à mesure que l’IA cherche à tout explorer, même ce qui ne lui est pas destiné.


Réagissez à cet article !

Demandez nos derniers articles !

Samsung Galaxy A57 : grâce à ces 2 offres cumulables, le smartphone passe à prix cassé !

Sorti il y a tout juste un mois, le Galaxy A57 est actuellement proposé à prix cassé sur le site officiel de Samsung. En effet, en cumulant le code MYPHONE…

Cette interdiction de Google censée lutter contre le piratage aurait eu l’effet totalement inverse

Google a interdit les publicités pour ebooks sur sa plateforme pour lutter contre le piratage. Mais selon des éditeurs qui le poursuivent en justice, seuls les vendeurs légaux auraient été…

Deux frères se font licencier, ils effacent les bases de données du gouvernement en à peine 5 minutes

Vous vous demandez pourquoi certaines entreprises suppriment les accès des employés avant de leur annoncer leur licenciement ? Cette histoire rocambolesque y répond parfaitement. Se faire licencier n’est jamais plaisant….

Amazon Fire TV Stick 4K Plus à -43% : le lecteur multimédia passe à petit prix !

Vous souhaitez connecter votre TV en un rien de temps ? Amazon propose actuellement son Fire TV Stick 4K Plus à 39,99€ au lieu de 69,99 €. C’est le bon moment pour…

Vous pouvez désormais concevoir n’importe quel widget Android grâce à cette idée de génie de Google

Les widgets Android sont souvent les mêmes pour tout le monde. Google vient d’annoncer une façon inédite d’en créer un qui vous ressemble vraiment. Une simple phrase suffit pour que…

Cette vidéo nous montre Aluminum OS, le nouveau concurrent de Windows basé sur Android

Aluminum OS, le système basé sur Android et successeur de Chrome OS, qui sera installé sur les nouveaux PC portables Googlebook, se montre dans une longue vidéo de 16 minutes….

PC

Le bouclier antimissile de Trump affiche une facture qui dépasse le PIB des Pays-Bas

Donald Trump veut couvrir les États-Unis d’un bouclier antimissile spatial. Un rapport officiel vient d’estimer sa facture réelle, et le chiffre est vertigineux. Ce projet divise déjà profondément, et sa…

Le prix du forfait mobile Série Free augmente, voici le nouveau tarif

Contre une dizaine de Go supplémentaires, Free augmente le prix de son forfait mobile 5G le plus abordable, qui devient plus cher que son équivalent chez RED by SFR. Free…

Le Steam Controller fait quelque chose de très innatendu quand il tombe (et c’est hilarant)

Un membre de Reddit a découvert un easter egg glissé par les équipes de Valve dans le Steam Controller. Si la manette tombe par mégarde, il est possible que celle-ci…

Google Home : Gemini gagne en efficacité et devient même votre mixologue personnel

Google a récemment élargi l’accès anticipé à Gemini au sein de Google Home, mais la firme ne s’en contente pas : elle continue de l’améliorer. La dernière mise à jour…