Mustafa Suleyman, responsable de l'IA chez Microsoft, a affirmé que tout contenu publié sur Internet devient libre d'utilisation. Cette déclaration contredit les lois actuelles sur les droits d'auteur et relance le débat sur l'utilisation équitable du contenu en ligne pour l'entraînement de l’intelligence artificielle.

Les droits d'auteur et l'utilisation du contenu en ligne sont des sujets complexes et souvent débattus. Les avancées technologiques, en particulier dans le domaine de l'intelligence artificielle, ont intensifié ces débats. La récente déclaration de Mustafa Suleyman, responsable de l'IA chez Microsoft, affirme que le contenu publié sur le web ouvert peut être librement utilisé par quiconque.

Cette déclaration intervient alors que Microsoft et OpenAI sont confrontés à plusieurs procès pour violation des droits d'auteur. En décembre 2023, le New York Times a porté plainte contre OpenAI, accusant l'entreprise de plagiat via ChatGPT. Le quotidien affirme que son IA a contourné les paywalls pour accéder à des articles protégés, les résumant et les imitant, ce qui pourrait entraîner une concurrence déloyale. De plus, en janvier 2024, l’entreprise a défendu son droit d’utiliser du contenu sous copyright pour entraîner son intelligence artificielle en expliquant que cela est nécessaire pour améliorer ses modèles.

Une oeuvre publiée sur Internet est automatiquement protégée par les droits d'auteur

En réalité, dès qu'une œuvre est créée, elle est automatiquement protégée par les droits d'auteur, que ce soit aux États-Unis, en France, ou dans de nombreux autres pays. Publier une œuvre sur le web ne signifie pas renoncer à ses droits. Le concept d’utilisation equitable ou “fair use” est une défense juridique déterminée par les tribunaux, qui évalue l'utilisation du contenu selon plusieurs critères, notamment la nature de l'œuvre et l'impact potentiel sur le marché de l'œuvre originale.

OpenAI a également été accusée par des écrivains, dont Sarah Silverman, d'utiliser des œuvres protégées par des droits d'auteur pour entraîner ses modèles d'IA. En février 2024, la cour fédérale de Californie a rejeté ces plaintes, estimant que l'utilisation de courts passages de texte à des fins d'apprentissage automatique est protégée par le “fair use”.

Suleyman reconnaît que certaines restrictions peuvent être imposées via les fichiers robots.txt, qui disent aux robots d'indexation quels contenus ne pas explorer ou copier. Cependant, il admet que l'efficacité et la légalité de ces restrictions sont incertaines et devront être décidées par les tribunaux dans le futur.