Récemment, un procès pour violation de droits d'auteur opposant OpenAI et le New York Times s'est ouvert devant un tribunal fédéral américain. Cette affaire a suscité un vif intérêt, car elle implique non seulement deux institutions de renom, mais pourrait aussi avoir des conséquences considérables sur l'ensemble de l'écosystème médiatique numérique. Devant le tribunal, OpenAI et son principal investisseur, Microsoft, ont demandé le rejet de l'action, tandis que le New York Times et les autres plaignants accusent OpenAI et Microsoft d'avoir utilisé leur contenu pour entraîner des grands modèles linguistiques (LLM) sans autorisation, et d'utiliser ces modèles pour concurrencer les plaignants, affectant ainsi leur trafic web et leurs revenus.

Les avocats du New York Times ont fait valoir devant le tribunal qu'OpenAI a probablement directement copié de nombreux articles de presse lors de l'entraînement de son modèle, allant parfois jusqu'à restituer des paragraphes entiers ou des articles complets en réponse aux questions des utilisateurs. Ils ont souligné que le fonctionnement des LLM diffère de celui des humains ; les machines ne peuvent pas comprendre et apprendre les informations comme le font les humains, et leur utilisation de contenu devrait donc être considérée comme une violation du droit d'auteur. De plus, ils ont fait remarquer que les moteurs de recherche traditionnels fournissent des liens originaux, permettant aux éditeurs de générer des revenus grâce à la publicité et aux abonnements, tandis que les moteurs de recherche génératifs fournissent directement les réponses, causant ainsi un préjudice aux éditeurs.

En revanche, les avocats d'OpenAI et de Microsoft soutiennent que leurs actions entrent dans le cadre de « l'utilisation équitable », c'est-à-dire l'utilisation de matériel protégé par le droit d'auteur sans nuire aux intérêts des détenteurs de droits d'auteur. Ils estiment que les LLM ne stockent pas le contenu protégé par le droit d'auteur spécifique pendant l'entraînement, mais s'appuient sur les pondérations de données obtenues grâce à l'entraînement. Par ailleurs, la défense a mentionné que les plaignants n'ont pas fourni suffisamment de preuves pour démontrer qu'ils ont subi un préjudice.

Devant le tribunal, les deux parties ont débattu avec véhémence sur les articles pertinents du droit d'auteur, le fonctionnement des LLM et la prescription. Le verdict aura une incidence importante sur la question de savoir si les entreprises d'IA peuvent entraîner leurs modèles en utilisant les œuvres des éditeurs sans autorisation.

Ce procès, qui implique OpenAI, fait également partie d'un ensemble de litiges similaires, actuellement soumis à examen pour plusieurs maisons d'édition. La date du verdict final reste inconnue, mais le juge Stein manifeste un vif intérêt pour l'affaire et pourrait prendre plus de temps pour l'examiner en profondeur.

Points clés :

📄 Un procès pour violation de droits d'auteur opposant le New York Times et OpenAI s'est ouvert devant un tribunal fédéral américain, soulevant d'importantes questions juridiques.

⚖️ OpenAI et Microsoft affirment que leur utilisation de contenu protégé par le droit d'auteur relève de « l'utilisation équitable », tandis que le New York Times estime qu'il s'agit d'une violation du droit d'auteur.

⏳ La décision du tribunal aura un impact majeur sur la légalité de l'utilisation par les entreprises d'IA des œuvres des éditeurs pour l'entraînement de leurs modèles.