Meta accusé d’avoir utilisé des livres piratés pour entraîner son IA

Un groupe d'auteurs, dont l'écrivain Ta-Nehisi Coates et l'humoriste Sarah Silverman, poursuit Meta en justice, accusant l'entreprise d'avoir sciemment utilisé des livres piratés pour entraîner ses modèles d'intelligence artificielle.

facebook mark zuckerberg

Selon des documents judiciaires rendus publics cette semaine en Californie, Mark Zuckerberg aurait personnellement approuvé l'utilisation de contenus protégés par le droit d'auteur pour entraîner son intelligence artificielle.

Au cœur de cette controverse se trouve LibGen, une base de données contenant environ 32 téraoctets de livres numérisés, considérée comme une « bibliothèque de l'ombre » d'origine russe. D'après les plaignants, des communications internes révèlent que Zuckerberg a validé l'utilisation de LibGen malgré les avertissements de son équipe dirigeante concernant la nature piratée des contenus.

Lire égalementLe patron de l’IA de Microsoft affirme que le contenu public sur Internet est libre d’utilisation, et ça l’arrange bien comme ça

Mark Zuckerberg aurait approuvé cette pratique controversée

Les documents judiciaires citent notamment un mémo faisant référence aux initiales de Zuckerberg (« MZ »), indiquant que « après remontée à MZ », l'équipe IA de Meta a reçu l'autorisation d'exploiter LibGen. Les ingénieurs de l'entreprise auraient même discuté de l'accès à ces données, tout en exprimant des réserves quant au téléchargement de torrents depuis des ordinateurs professionnels.

Cette nouvelle action en justice fait suite à une première plainte déposée en 2023, rejetée par le juge fédéral Vince Chhabria. Les auteurs affirment que ces nouvelles preuves renforcent non seulement leurs accusations initiales d'atteinte aux droits d'auteur, mais pourraient également justifier l'ajout d'une accusation de fraude informatique.

Le contexte est particulièrement sensible pour Meta, qui utilise ces données pour entraîner Llama, son modèle de langage alimentant ses chatbots. L'année dernière, un tribunal fédéral de New York avait déjà condamné les opérateurs anonymes de LibGen à verser 30 millions de dollars de dommages et intérêts à un groupe d'éditeurs pour violation de droits d'auteur.

Cette affaire s'inscrit dans un débat plus large sur l'utilisation de contenus protégés pour l'entraînement des modèles d'IA générative. Les professionnels de la création et les éditeurs alertent sur les risques que ces pratiques font peser sur leurs moyens de subsistance et leurs modèles économiques.

Bien que le juge Chhabria ait accepté le dépôt d'une plainte amendée, il a exprimé des doutes quant aux chances de succès des accusations de fraude. Meta n'a pas encore répondu publiquement à ces nouvelles allégations.


Abonnez-vous gratuitement à la newsletter

Chaque jour, le meilleur de Phonandroid dans votre boite mail !

Réagissez à cet article !

Demandez nos derniers articles !

Les Galaxy S26 sont capables de trouver le moment exact de la vidéo que vous cherchez grâce à l’IA

Il n’est pas toujours facile de savoir dans quelle vidéo se trouve ce moment hilarant que vous souhaitez montrer à un proche et les Galaxy S26 comptent bien régler ce…

Gemini devient encore plus intelligent avec ces nouvelles fonctionnalités

En parallèle de la sortie des Galaxy S26, Google annonce les nouveautés de son IA Gemini. Elle devient capable de faire encore plus de choses à votre place. De quoi…

IA

Adobe Firefly vous fait gagner un temps fou sur le montage vidéo grâce à sa nouvelle fonction IA

Le montage vidéo prend souvent des heures, même pour des projets simples. Adobe veut accélérer cette étape grâce à l’intelligence artificielle. Une nouvelle fonction de Firefly promet de créer un…

IA

Outlook : Microsoft a trouvé un nouveau moyen hyper intrusif de vous forcer à utiliser son IA Copilot

Microsoft veut absolument que vous aimiez son IA Copilot et compte bien pour cela vous forcer à l’utiliser contre votre gré. D’ici quelques mois à peine, une nouvelle fonctionnalité d’Outlook…

Les patrons de Disney ont vu Avengers Doomsday, voici ce qu’ils en ont pensé

La sortie d’Avengers Doomsday approche. En attendant, des personnes haut placées chez Disney ont pu voir à quoi ressemble le film. Leur avis est-il rassurant ou inquiétant ? 7 ans…

ChatGPT va proposer une offre à 100 dollars par mois, pour ceux qui sont limités par la version Plus

Du code déniché dans la version web de ChatGPT laisse entendre qu’une nouvelle formule d’abonnement est sur le point d’arriver. Baptisée “Pro Lite”, celle-ci devrait se positionner entre les formules…

IA

Des publicités Google piégées échappent aux contrôles grâce à cet outil pirate

Les publicités en ligne sont devenues un terrain de jeu pour les cybercriminels. Certains outils permettent désormais de contourner les systèmes de vérification des grandes plateformes. Une nouvelle menace vise…

Xbox Game Pass : le streaming en 1440p est désormais disponible sur console, mais seulement pour certains joueurs

Microsoft vient d’annoncer une grande amélioration de son service cloud gaming : les jeux peuvent désormais être streamés en 1440p. Néanmoins, comme on pouvait s’y attendre, tout le monde ne…

HP alerte sur la crise de la RAM qui fait exploser les coûts de ses PC

La mémoire vive coûte de plus en plus cher aux fabricants. Même les plus grands acteurs du marché sont touchés. HP reconnaît que la situation pèse lourdement sur le prix…

PC

Uber Air devient une réalité : on va bientôt pouvoir réserver des taxis volants

Avec Uber Air, les utilisateurs pourront réserver un taxi aérien 100 % électrique depuis leur application. Voici ce qu’on sait sur ce projet qui est en train de se matérialiser….