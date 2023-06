Une plainte a été déposée par 16 personnes à l’encontre d’OpenAI et de Microsoft, accusés d’avoir volé des données pour entraîner ChatGPT. Ces derniers réclament pas moins de 3 milliards de dollars de dommages et intérêts, arguant que de nombreux internautes ont vu leurs données confidentielles utilisées sans leur consentement.

L’impressionnante puissance de ChatGPT a de quoi pousser à l’interrogation : comment OpenAI a-t-elle entraîné son intelligence artificielle pour obtenir un résultat aussi précis ? Pour certains, la réponse est on ne peut plus claire : l’entreprise a délibérément volé une immense quantité de données pour nourrir son chatbot, sans en prévenir leurs véritables propriétaires, ni payer les auteurs de ces informations.

C’est ce qu’arguent 16 personnes ayant déposé plainte ce mercredi 28 juin contre la firme et Microsoft, dont l’outil Bing Chat est également basé sur GPT-4. « Malgré les protocoles établis pour l’achat et l’utilisation d’informations personnelles, les accusés ont adopté une approche différente : le vol », explique la plainte. En plus de millions d’articles sur le web, les deux firmes auraient également utilisé les données personnelles de nombreux internautes.

Ils réclament 3 milliards de dollars à OpenAI et Microsoft pour vol de données

« Ils ont systématiquement extrait 300 milliards de mots sur Internet, livres, articles, sites web et messages — y compris des informations personnelles obtenues sans consentement. OpenAI l’a fait en secret et sans s’enregistrer en tant que courtier en données, comme l’exige la législation en vigueur », poursuivent les plaignants, qui réclament désormais 3 milliards de dollars de dommages et intérêts.

Les données récupérées concernent notamment les loisirs, les opinions politiques, les orientations sexuelles ou encore l’appartenance à une religion. Au-delà de l’utilisation non autorisée de ces données, les plaignants reprochent également aux deux entreprises de ne pas « filtrer suffisamment dans les modèles d’entraînement, ce qui expose des millions de personnes au risque de voir ces informations divulguées sur Internet ou à des étrangers dans le monde entier ».

Source : The Register