Según la revista Wired, varias empresas tecnológicas gigantes, incluyendo Apple, Nvidia, Anthropic y Salesforce, han sido descubiertas utilizando miles de videos de YouTube sin permiso para entrenar sus modelos de inteligencia artificial, lo que ha generado una seria controversia sobre derechos de autor y ética.

El informe revela que estas compañías integraron los subtítulos de diversos videos de YouTube en sus conjuntos de datos de entrenamiento de IA. Los creadores afectados abarcan una amplia gama, incluyendo a conocidos bloggers como MKBHD, MrBeast y Jacksepticeye; comediantes como Stephen Colbert, John Oliver y Jimmy Kimmel; canales educativos como el MIT, Khan Academy y Harvard; y medios de comunicación como The Wall Street Journal y NPR.

Robot, Inteligencia Artificial, Reconocimiento Facial, IA

Nota de la fuente: Imagen generada por IA, proveedor de servicios de licencias de imágenes Midjourney

Estos datos fueron descargados y recopilados por una organización sin fines de lucro llamada Eleuther AI. La organización proporcionó este contenido como parte de su gran conjunto de datos "The Pile", inicialmente destinado a proporcionar material de entrenamiento para pequeños desarrolladores y académicos. Sin embargo, estos conjuntos de datos fueron posteriormente utilizados por grandes empresas tecnológicas.

Cabe destacar que compañías como Apple no descargaron directamente estos datos de YouTube, sino que utilizaron el conjunto de datos recopilado por Eleuther AI. Desde un punto de vista técnico, la violación de los términos de uso de YouTube la cometió Eleuther AI, no las empresas tecnológicas.

Este incidente ha suscitado un debate sobre la legalidad y la ética de las fuentes de datos de entrenamiento de IA. Destaca la importancia de los derechos de autor y las licencias de uso de datos en el campo de la IA en rápida evolución, así como las deficiencias de las leyes y regulaciones existentes para abordar estos nuevos desafíos tecnológicos. Al mismo tiempo, plantea nuevas reflexiones sobre el equilibrio de los derechos entre creadores, plataformas y empresas de IA.