Recientemente, se ha revelado una operación secreta de la gigante tecnológica Nvidia relacionada con la obtención de datos. Según el medio 404, Nvidia ha estado recopilando enormes cantidades de datos de videos de YouTube para entrenar sus modelos de inteligencia artificial, una práctica legal y éticamente ambigua.

Nvidia

El informe indica que Nvidia está utilizando estos datos de video para entrenar varios modelos de IA, incluyendo el modelo de aprendizaje profundo Cosmos, algoritmos de conducción autónoma, productos de avatares de IA humanos digitales y la herramienta de construcción de mundos 3D Omniverse.

Se entiende que Nvidia ha empleado varias medidas encubiertas para ocultar su actividad de recopilación de datos, utilizando múltiples "máquinas virtuales" y cambiando continuamente las direcciones IP para evitar ser detectada por YouTube. Además, ni los creadores de videos ni Google, la empresa matriz de YouTube, autorizaron esta actividad de recopilación de datos. La comunicación interna de Nvidia muestra una estrategia bastante audaz; un alto ejecutivo mencionó en un correo electrónico que estaban construyendo una "fábrica de datos de video" capaz de generar diariamente una cantidad de datos visuales equivalentes a la experiencia visual de una vida humana.

Curiosamente, cuando los empleados expresaron su preocupación sobre la legalidad y la ética de esta obtención de datos, la gerencia se mostró bastante confiada, argumentando que todo era una decisión de la alta dirección. Un correo electrónico decía: "Tenemos una aprobación completa para todos los datos".

Más inquietante aún es que Nvidia supo durante un tiempo que estaba utilizando un conjunto de datos llamado HD-VG-130M que contenía 130 millones de videos de YouTube, un conjunto de datos creado originalmente para investigación académica. Muchos expertos han expresado su fuerte descontento, considerando que el uso de datos de investigación para fines comerciales es una práctica indebida.

Como participante clave en la industria de la IA, Nvidia ocupa una posición destacada en el mercado, y sus unidades de procesamiento gráfico (GPU) son la base de muchos sistemas de IA intensivos en computación. Empresas que colaboran con Nvidia, como OpenAI, Microsoft y Google, han expresado su preocupación por este comportamiento. Un portavoz de Google mencionó que el uso no autorizado de datos de YouTube es una clara violación de las condiciones del servicio de la plataforma.

Nvidia, en respuesta a los medios, afirma que su entrenamiento de IA "cumple plenamente con el espíritu y la letra de la ley de derechos de autor". Sin embargo, ¿qué opinarán los creadores de estos contenidos?

Puntos clave:

📹 Nvidia recopila secretamente una gran cantidad de datos de video de YouTube para entrenar su IA, lo que genera preocupación por problemas legales y éticos.

💻 Los correos electrónicos internos muestran que los ejecutivos de Nvidia consideran que esta acción tiene una aprobación completa, mostrando una actitud bastante audaz.

📜 Google señala que el uso no autorizado de datos de YouTube viola claramente las condiciones del servicio de la plataforma, y la respuesta de Nvidia genera controversia.