ChatGPT : OpenAI est traîné en justice pour avoir formé son IA avec des livres piratés

OpenAI et Microsoft sont de plus en plus pointés du doigt pour leur interprétation un peu étrange du droit d’auteur. Leur invention ChatGPT aurait été entraînée grâce à du contenu piraté.

hacker-ecran-ordinateur
Crédit : 123rf

De nombreux utilisateurs profitent d’ores et déjà des IA génératives pour créer des œuvres graphiques, mais aussi littéraires, et parfois, pour en tirer profit. OpenAI, la startup qui avec ChatGPT est à la genèse de cette révolution numérique et sociétale, est accusée par deux écrivains d’avoir utilisé leur contenu pour entraîner leur IA.

À lire — ChatGPT : OpenAI et Microsoft risquent une amende de 3 milliards de dollars pour vol de données

Les artistes reprochent aux créateurs de grands modèles de langage d’utiliser des sources normalement payantes pour former leurs chatbots. Si l’objectif des grands noms de la Silicon Valley est de tirer profit de l’Intelligence artificielle, les auteurs des « sources » originales ne recevront peut-être aucune contrepartie malgré leur contribution pourtant essentielle.

OpenAI est accusé d’avoir utilisé des livres piratés pour former ChatGPT

Selon Torrent Freak, « cette semaine, les auteurs Paul Tremblay et Mona Awad ont déposé un recours collectif contre OpenAI, accusant la société mère de ChatGPT de violation des droits d’auteur. Selon eux, ChatGPT a été partiellement formé sur leurs œuvres protégées par le droit d’auteur, sans autorisation ». L’accusation est grave. Comment les plaignants peuvent-ils être si sûrs qu’OpenAI a formé son chatbot sur leurs œuvres ? Pour M. Tremblay et Mme Awad, la preuve est évidente : « ChatGPT génère des résumés des œuvres protégées des plaignants, ce qui n’est possible que si ChatGPT a été formé sur ces œuvres ».

Mais l’accusation va plus loin encore. D’après MM. Tremblay et Awad, OpenAI aurait utilisé du contenu recueilli sur des sites de piratage de livres comme Z-Library. En effet, si la compagnie reste évasive sur la provenance des sources ayant servi à former son IA, on sait que ChatGPT a été entraîné sur au moins 360 000 livres. L’entreprise a-t-elle payé pour « s’inspirer » de ces œuvres ? On ne peut le savoir, mais les plaignants notent tout de même que « OpenAI a dû utiliser des ressources piratées, car il n’existe pas de bases de données légitimes contenant autant de livres ».


Réagissez à cet article !

Demandez nos derniers articles !

Cette éruption solaire vient de couper les communications radio et pourrait offrir des aurores boréales

Le Soleil vient de lâcher une puissante éruption, accompagnée d’un nuage de plasma en route vers la Terre. Le choc pourrait survenir dès cette nuit. Des aurores boréales sont attendues…

Quelle est votre première chanson et votre artiste le plus écouté sur Spotify ? Voici comment le savoir

Pour célébrer ses 20 ans, Spotify lance un outil de type Wrapped, mais qui fait le bilan de votre présence sur la plateforme depuis vos débuts plutôt que de la…

Dreamina AI : la génération de vidéos ultra-réalistes est restreinte en France, voici pourquoi et comment la débloquer

ByteDance propose l’un des générateurs vidéo IA les plus impressionnants du moment, mais l’accès est volontairement bridé en France et dans l’UE. Voici comment en profiter plus confortablement pour en…

Free active l’option eSIM pour les Samsung Galaxy Watch, et c’est gratuit !

Les abonnés Free Mobile peuvent désormais accéder gratuitement à l’eSIM sur leur montre connectée Samsung Galaxy Watch. Les Google Pixel Watch seront bientôt prises en charge également. En décembre dernier,…

One UI 9 : la bêta est enfin ouverte au public, votre smartphone est-il éligible ?

Quelques heures après que la rumeur s’est diffusée dans le monde entier, Samsung a fini par lâcher le morceau : la première bêta publique de One UI 9 sera disponible…

JBL rend officielle la série JBL Live 4 : des écouteurs conçus pour une expérience complète et sur mesure encore plus fluide

JBL a officialisé sa nouvelle série d’écouteurs avec boîtier Smart Charging Case : la gamme JBL Live 4. Caractéristiques principales, prix, nouveautés… Voici ce qu’il faut retenir des trois modèles qui…

Les JBL Live 680NC et 780NC sont officiels : ces casques pensés pour le quotidien allient style, confort et qualité audio

JBL officialise sa nouvelle gamme de casques Live : les JBL Live 680NC et 780NC. La marque a fait évoluer plusieurs aspects afin de proposer des produits pensés pour le quotidien,…

JBL officialise le EasySing Mic Mini : faites entendre votre voix partout grâce à ce micro nomade dopé à l’IA

JBL vient de présenter plusieurs produits. Aux côtés des nouvelles générations de casques, écouteurs et PartyBox, un appareil fait figure de nouveauté totale : le EasySing Mic Mini, un micro de…

JBL officialise les enceintes PartyBox 130 et 330 ou comment faire la fête intensément jusqu’au bout de la nuit

En même temps que ses nouvelles séries de casques, d’écouteurs et d’un produit inédit, JBL vient d’officialiser la dernière génération de ses enceintes festives, composée des PartyBox 130 et PartyBox…

Voiture électrique : Lexus rattrape enfin Tesla en ajoutant cette option fondamentale

Il était temps que les voitures électriques Lexus se mettent au niveau de la concurrence. Surtout au niveau d’une fonction très utilisée ailleurs depuis des années et totalement absente des…