L'outil de génération vidéo d'OpenAI, Sora, a suscité beaucoup d'attention depuis son lancement, mais son origine est restée un mystère. Aujourd'hui, une partie de ce mystère semble se dévoiler : les données d'entraînement de Sora pourraient bien contenir une quantité importante de vidéos de jeux en streaming et de guides vidéo provenant de Twitch !
Sora est comme un maître imitateur chevronné. À partir d'une simple invite textuelle ou d'une image, il peut générer des vidéos de 20 secondes, maîtrisant différentes proportions et résolutions. En février dernier, lors de la première présentation publique de Sora, OpenAI a laissé entendre que son modèle avait « perfectionné son art » sur des vidéos de Minecraft. Mais outre Minecraft, quels autres jeux vidéo ont contribué à la « formation » de Sora ?
Les résultats sont surprenants. Sora semble maîtriser divers genres de jeux vidéo. Il peut générer une vidéo d'un jeu clone de Mario avec une ombre de Mario, même si quelques imperfections subsistent. Il peut également simuler des scènes de jeux de tir à la première personne palpitantes, comme un mélange de Call of Duty et de Counter-Strike. Il est même capable de reproduire des scènes de combat du jeu d'arcade des Tortues Ninja des années 90, transportant le spectateur dans ses souvenirs d'enfance.

Plus étonnant encore, Sora semble parfaitement connaître le format des streams Twitch, ce qui suggère qu'il a « regardé » de nombreuses vidéos en direct. Les captures d'écran des vidéos générées par Sora reproduisent non seulement la structure des streams, mais elles représentent même avec précision l'image du streamer connu Auronplay, y compris son tatouage sur le bras gauche.

De plus, Sora « connaît » une autre streameuse Twitch, Pokimane, et a généré des vidéos de personnages qui lui ressemblent. Bien sûr, pour éviter les problèmes de droits d'auteur, OpenAI a mis en place un mécanisme de filtrage empêchant Sora de générer des vidéos contenant des personnages protégés par des marques.
Bien qu'OpenAI reste discret sur l'origine de ses données d'entraînement, de nombreux indices suggèrent que du contenu de jeux vidéo a très probablement été intégré dans l'ensemble de données de Sora. La directrice technique d'OpenAI, Mira Murati, n'a pas directement démenti, lors d'une interview accordée au Wall Street Journal en mars, l'utilisation de contenu provenant de YouTube, Instagram et Facebook pour l'entraînement de Sora. OpenAI reconnaît également dans les spécifications techniques de Sora l'utilisation de données « publiquement disponibles » et de données sous licence provenant de banques d'images comme Shutterstock.

Si du contenu de jeux vidéo a effectivement été utilisé pour l'entraînement de Sora, cela pourrait entraîner de nombreux problèmes juridiques, notamment si OpenAI développe des expériences plus interactives basées sur Sora. Joshua Wagensberg, avocat spécialisé en propriété intellectuelle chez Pryor Cashman, souligne que l'utilisation non autorisée de vidéos de jeux vidéo pour l'entraînement de l'IA présente des risques importants, car l'entraînement de modèles d'IA nécessite généralement la reproduction des données d'entraînement, et les vidéos de jeux contiennent une grande quantité de contenu protégé par des droits d'auteur.
Les modèles d'IA génératifs comme Sora sont basés sur les probabilités. Ils apprennent des schémas à partir d'un grand nombre de données pour faire des prédictions. Cette capacité leur permet d'« apprendre » le fonctionnement du monde. Mais cela présente également des risques : sous certaines invites, le modèle peut générer du contenu très similaire à ses données d'entraînement. Cela provoque un mécontentement important chez les créateurs, qui estiment que leurs œuvres sont utilisées sans autorisation pour l'entraînement.
Actuellement, Microsoft et OpenAI sont poursuivis pour la reproduction présumée de code sous licence dans leurs outils d'IA. Des applications d'art IA comme Midjourney, Runway et Stability AI sont également accusées de violation des droits des artistes. Les grandes maisons de disques ont également intenté des poursuites contre les start-ups Udio et Suno, développeuses de générateurs de musique IA.
De nombreuses entreprises d'IA invoquent depuis longtemps le principe de « l'utilisation équitable », estimant que leurs modèles créent des œuvres « transformatives » et non des copies. Mais le contenu des jeux vidéo présente une spécificité. Evan E. Averill, avocat spécialisé en droit d'auteur chez Dorsey & Whitney, souligne que les vidéos de jeux vidéo sont protégées par au moins deux couches de droits d'auteur : les droits d'auteur sur le contenu du jeu détenus par les développeurs de jeux, et les droits d'auteur sur la vidéo unique créée par le joueur ou le vidéaste. Pour certains jeux, il peut exister une troisième couche de droits, à savoir les droits d'auteur sur le contenu généré par les utilisateurs.
Par exemple, Fortnite permet aux joueurs de créer leurs propres cartes de jeu et de les partager. Une vidéo de jeu concernant ces cartes impliquerait au moins trois détenteurs de droits d'auteur : Epic, le joueur et le créateur de la carte. Si un tribunal juge que l'entraînement des modèles d'IA engage une responsabilité en matière de droits d'auteur, tous ces détenteurs de droits d'auteur pourraient devenir des plaignants potentiels ou des sources de licences.
En outre, M. Wagensberg souligne que les jeux eux-mêmes possèdent de nombreux éléments « protégeables », tels que des textures propriétaires, et que les juges pourraient tenir compte de ces éléments dans les litiges en matière de propriété intellectuelle.

À l'heure actuelle, plusieurs studios et éditeurs de jeux vidéo, dont Epic, Microsoft (propriétaire de Minecraft), Ubisoft, Nintendo, Roblox et CD Projekt Red (développeur de Cyberpunk 2077), n'ont pas encore réagi à cette affaire.
Même si les entreprises d'IA gagnent ces litiges, les utilisateurs pourraient ne pas être exonérés de responsabilité. Si un modèle génératif reproduit une œuvre protégée par des droits d'auteur, la personne qui publie cette œuvre ou l'intègre à d'autres projets pourrait toujours être poursuivie pour violation des droits de propriété intellectuelle.
Certaines entreprises d'IA ont mis en place des clauses d'indemnisation pour faire face à ces situations, mais il existe généralement des exceptions. Par exemple, les clauses d'OpenAI ne s'appliquent qu'aux clients professionnels, et non aux utilisateurs particuliers. En plus des risques liés aux droits d'auteur, il existe des risques de violation des marques, par exemple si le contenu généré contient des éléments utilisés pour le marketing et la promotion de la marque, y compris les personnages de jeux vidéo.
Avec l'intérêt croissant pour les modèles du monde, la situation pourrait devenir encore plus complexe. Une application des modèles du monde consiste à générer des jeux vidéo dans le monde réel. Si ces jeux « synthétiques » sont trop similaires au contenu utilisé pour l'entraînement du modèle, cela pourrait entraîner des problèmes juridiques.
Avery Williams, avocat spécialisé dans les litiges en matière de propriété intellectuelle chez McKool Smith, souligne que l'entraînement d'une plateforme d'IA sur des éléments de jeu tels que la voix, les mouvements, les personnages, les chansons, les dialogues et les œuvres d'art constitue une violation du droit d'auteur. Les questions relatives à « l'utilisation équitable » soulevées dans les nombreuses poursuites intentées contre les entreprises d'IA génératives auront le même impact sur l'industrie du jeu vidéo que sur les autres marchés créatifs.