Instagram, YouTube, TikTok : vos données sont-elles utilisées pour entraîner l’IA des géants du web ?

Pour continuer de s'améliorer, l'IA a besoin d'une chose : une quantité continue et infinie de données. Comment les géants du web comme TikTok, Instagram ou YouTube font-ils pour alimenter leur intelligence artificielle ? D'après cette étude, ils pourraient être nombreux à se servir directement des données des utilisateurs.

etude donnees IA plateformes
Crédits : Adobe Stock

Aujourd'hui, l'IA est partout. Sur les réseaux sociaux, sur nos navigateurs, dans les logiciels de bureautique, directement intégrée dans nos smartphones… On en trouve même dans les jouets pour enfant ! Forcément, pour continuer à abreuver et améliorer les compétences de leurs IA respectives, les géants du web ont besoin d'une quantité infinie et continue de données.

Incogni, société spécialisée dans la suppression des données sur le web, s'est justement penchée sur cette question épineuse, à savoir comment les plateformes gèrent la confidentialité des données des utilisateurs à l'heure de l'IA. Pour aboutir à un classement général, les experts d'Incogni ont donc identifié les 15 plateformes les plus populaires (en fonction du nombre d'utilisateurs mensuels) avant de les classer sur 14 critères précis répartis en 6 catégories :

  • intégration et formation à l'IA
  • violations réglementaires liées à la confidentialité
  • collecte de données
  • contrôle et consentement de l'utilisateur
  • transparence et accessibilité
etude donnees IA plateformes
Crédits : Adobe Stock

Vos données sont-elles utilisées pour l'IA ? Le flou demeure sur trop de plateformes

En premier lieu, Incogni s'est intéressée à l'intégration de l'IA sur les réseaux sociaux, et surtout sur son impact sur la vie privée des utilisateurs. L'idée étant de chercher à savoir si vos données peuvent être utilisées pour entraîner les modèles d'IA des plateformes, si des entreprises partenaires peuvent les exploiter ou encore s'il est possible ou non de manifester son refus.

Trois bons élèves seulement sur 15

Pour ce faire, l'entreprise a passé au peigne fin la politique de confidentialité de chaque plateforme ainsi que toutes les ressources juridiques et de confidentialité accessibles aux utilisateurs. Concrètement, Telegram, Twitch et Discord font partie des meilleurs élèves. Pour cause, ces trois plateformes sont les seules du classement à affirmer explicitement que les données des utilisateurs ne seront pas exploitées pour entraîner l'IA ou cédées à d'autres entreprises spécialisées dans l'IA. Chez Quora, on saluera le fait que les utilisateurs peuvent au moins refuser de voir leurs données exploiter par des entreprises partenaires.

etude donnees IA plateformes
Crédits : Incogni

Le flou chez TikTok et Reddit

Concernant TikTok, le discours du réseau chinois est un peu contradictoire. Si le terme IA n'est jamais mentionné explicitement dans sa politique de confidentialité, il est toutefois précisé que les données des utilisateurs pourront être utilisées pour “améliorer les modèles d'apprentissage automatique et développer des produits”. Or, quand on sait que TikTok a présenté en mai dernier AI Alive, une IA qui permet d'animer des photos, il y a de fortes chances pour que vos données soient utilisées pour l'entraîner.

Du côté de Reddit, la plateforme a confirmé qu'elle n'entraînait pas de modèles génératifs. Néanmoins, elle a donné accès au contenu généré par les utilisateurs à plusieurs développeurs d'IA.

Une pratique assumée chez les autres

En revanche, certaines plateformes affirment sans sourciller qu'elles s'emparent des données des utilisateurs pour entraîner leurs modèles génératifs. Sans réelle surprise, on retrouve dans le lot les principaux services de Meta comme Facebook Messenger, Instagram, Facebook ou encore WhatsApp. C'est également le cas de YouTube, de Snapchat, de Pinterest, de X ou encore de LinkedIn.

À lire également : L’IA a déjà commencé à voler des emplois, voici les secteurs les plus touchés

Quelles sont les données collectées par les plateformes ?

Pour cette section, les chercheurs d'Incogni ont déterminé la quantité de données collectées par les plateformes pour entraîner leur IA. Ici encore, certains résultats font froid dans le dos. Concrètement, voici le type de données qui sont le plus souvent récupérées par les plateformes pour entraîner leur IA :

  • les identifiants
  • les informations commerciales
  • l'historique internet et les informations sur votre machine
  • la géolocalisation
  • certaines informations audio et visuelles (photos, vidéos, messages vocaux, etc.)
etude donnees IA plateformes
Crédits : Incogni

Ainsi, toutes les plateformes, à l'exception de WhatsApp, Telegram et Quora, pouvaient tirer des conclusions des autres données collectées pour établir le profil des utilisateurs. Des données professionnelles ou liées à votre emploi sont également collectées par les services de Meta (à l'exception de WhatsApp), Pinterest, X, Reddit, Quora, LinkedIn et Twitch.

Pire encore, les chercheurs ont constaté que les plateformes engrangeaient également d'autres informations via leur appli mobile. LinkedIn collecte ainsi des données sur l'origine ethnique des utilisateurs, tandis que la majorité des services de Meta (sauf WhatsApp) peuvent récupérer des données sur l'orientation sexuelle et la santé des utilisateurs. Quant à votre historique de recherche, il peut être transmis à des tiers chez Pinterest, Reddit et Quora.

Réagissez à cet article !

Demandez nos derniers articles !

L’iPhone 18 Pro pourrait coûter une fortune, et vous ne devinerez jamais pourquoi

Les nombreuses nouveautés dont bénéficiera probablement l’iPhone 18 Pro pourraient avoir un coût, et non des moindres. Certains analystes estiment ainsi que certains composants, tels que le nouvel objectif du…

Vous cherchez ChatGPT sur Google ? Attention à cette nouvelle arnaque

Méfiez-vous de ceux qui se feraient passer pour ChatGPT. Des chercheurs en cybersécurité ont en effet découvert une nouvelle arnaque qui permet aux hackers d’imiter le célèbre chatbot d’OpenAI… Avec…

Fable : face à GTA 6, Xbox capitule et repousse son RPG culte

Mauvaise nouvelle pour les fans qui espéraient retourner en Albion cette année. En effet, Xbox a officiellement annoncé le report de la sortie du reboot de Fable, qui ne verra…

Faute de Steam Deck, ce bricoleur fou transforme sa PS2 en console portable

Plus besoin de dépenser des centaines d’euros pour un Steam Deck quand on peut fabriquer son « équivalent » soi-même. C’est le pari fou d’un bricoleur du dimanche, qui a…

Samsung va présenter le futur du bien-être connecté par IA à VivaTech 2026

Samsung sera présent à Paris pour l’édition 2026 du salon VivaTech. L’entreprise annonce qu’elle y annoncera “sa vision d’un bien-être connecté porté par l’IA”. VivaTech, l’événement français dédié à l’innovation…

Il envoie son Pixel 10 Pro XL en réparation chez Google, le smartphone revient dans un pire état

Un propriétaire de Pixel 10 Pro XL dénonce Google, dont il qualifie la garantie d’arnaque. Son smartphone lui a été retourné sans être réparé, et avec un nouveau problème qui…

Après l’orange de l’iPhone 17 Pro, Apple préparerait de nouveaux coloris audacieux pour l’iPhone 18 Pro

Un coloris bleu ciel et un autre rouge cerise. Voici ce que nous préparerait Apple pour son iPhone 18 Pro, enorgueilli par le succès de la version orange vif de…

Bon plan Galaxy Z Flip 7 : Samsung offre près de 300 € de réduction sur son smartphone pliable ce week-end

Déjà affiché près de 200 € sous son tarif de lancement, le Galaxy Z Flip 7 voit son prix chuter davantage sur le site Samsung. Grâce au code promo MAMAN10,…

Ninja CREAMi Deluxe 10-en-1 : bon plan sur le pack machine à glace + 4 pots, ça va vous rafraîchir !

Depuis plusieurs jours, la canicule s’est installée en France. Chacun fait comme il peut pour se rafraîchir et les glaces ont un franc succès. Mais saviez-vous qu’il existe une machine…

Ce VPN complet avec antivirus intégré est à un petit prix (-88%), avec 4 mois offerts

Surfshark fait partie des rares VPN à proposer une offre très complète pour un tarif situé sous la barre des 2 €. Grâce à une offre exclusive aux lecteurs de…