Récemment, le tribunal de district du district nord de la Californie a rendu un jugement dans une affaire de violation de droits d'auteur qui a suscité un vif intérêt, rejetant en partie les demandes concernant l'outil de programmation GitHub Copilot et sa technologie sous-jacente, OpenAI Codex. Cette décision pourrait créer un précédent pour les nouveaux outils technologiques utilisant des données protégées par des droits d'auteur pour leur entraînement.

Le procès, intenté en 2022 par le cabinet d'avocats Joseph Saveri Law Firm, affirmait que GitHub et OpenAI permettaient à Copilot et Codex de reproduire du code source sans respecter les clauses de licence, notamment les mentions de copyright et les attributions, constituant ainsi une violation des droits d'auteur.

Robot Intelligence artificielle IA

Source : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney

Le tribunal a rejeté les demandes des plaignants fondées sur l'article 1202(b) du Digital Millennium Copyright Act (DMCA), qui interdit la suppression des mentions de copyright. Le tribunal a statué que les plaignants n'avaient pas prouvé que Copilot avait tendance à reproduire du code protégé par des droits d'auteur de manière identique.

Les plaignants ont cité une étude selon laquelle la probabilité que le système reproduise mot pour mot les données d'entraînement augmente avec l'augmentation de la taille du modèle. Cependant, le juge Jon S. Tigar a fait remarquer que cette étude montrait que « Copilot reproduit rarement du code mémorisé dans des conditions bénignes, la plupart des mémorisations ne se produisant que lorsque le modèle est incité à fournir de longs extraits de code très similaires aux données d'entraînement ».

Ce jugement suggère que les revendications de droits d'auteur pourraient être contestées si les nouveaux systèmes technologiques ne reproduisent pas régulièrement mot pour mot leurs données d'entraînement lors d'une utilisation normale. Cette décision pourrait également avoir une incidence sur d'autres litiges similaires, tels que le différend sur les droits d'auteur entre OpenAI et le New York Times.

Bien que le tribunal ait rejeté les accusations d'enrichissement sans cause et de concurrence déloyale, il a autorisé la poursuite des accusations de violation des licences open source. Les plaignants soutiennent que Copilot a reproduit du code sans attribution, violant ainsi les clauses des licences open source.

Matthew Butterick, programmeur et avocat impliqué dans le procès, a souligné les préoccupations concernant les violations potentielles des licences open source, estimant que des outils de programmation comme Copilot monétisent des œuvres open source sans autorisation.

Ce jugement a suscité un large débat au sein de l'industrie sur l'avenir des technologies émergentes, de la protection des droits d'auteur et des logiciels open source.