Nvidia acusada de coletar secretamente dados de vídeos do YouTube para treinar IA

Recentemente, uma operação secreta da gigante de tecnologia Nvidia para aquisição de dados foi exposta. De acordo com a reportagem do site 404, a Nvidia tem coletado dados em massa de vídeos do YouTube para treinar seus modelos de inteligência artificial, uma prática que levanta sérias questões legais e éticas.

Nvidia

O relatório indica que a Nvidia está usando esses dados de vídeo para treinar vários modelos de IA, incluindo o modelo de aprendizado profundo Cosmos, algoritmos de direção autônoma, produtos de avatar de IA humana digital e a ferramenta de construção de mundos 3D Omniverse.

Entende-se que a Nvidia adotou várias medidas ocultas para disfarçar sua coleta de dados, usando várias "máquinas virtuais" e alterando constantemente os endereços IP para evitar ser detectada pelo YouTube. Além disso, os criadores de vídeo e a empresa matriz do YouTube, o Google, não autorizaram essa coleta de dados. A comunicação interna da Nvidia mostra que sua estratégia era bastante ousada, com um executivo mencionando em um e-mail que estava construindo uma "fábrica de dados de vídeo" capaz de gerar dados de experiência visual equivalentes a uma vida humana por dia.

Curiosamente, quando os funcionários expressaram preocupações sobre a legalidade e a ética dessa aquisição de dados, a administração demonstrou grande confiança, afirmando que tudo era decisão da alta gerência. O e-mail dizia: "Temos uma aprovação abrangente para todos os dados."

Ainda mais preocupante é que a Nvidia, por um tempo, soube que estava usando um conjunto de dados HD-VG-130M contendo 130 milhões de vídeos do YouTube, originalmente criado para pesquisa acadêmica. Muitos especialistas expressaram forte insatisfação, considerando o uso de dados de pesquisa para fins comerciais uma conduta imprópria.

Como participante central da indústria de IA, a Nvidia ocupa uma posição de destaque no mercado, com suas unidades de processamento gráfico (GPUs) sendo a base de muitos sistemas de IA de uso intensivo de computação. Empresas que trabalham com a Nvidia, como OpenAI, Microsoft e Google, expressaram preocupação com esse comportamento. Um porta-voz do Google mencionou que o uso não autorizado de dados do YouTube é uma clara violação dos termos de serviço da plataforma.

Em resposta à mídia, a Nvidia afirmou que seu treinamento de IA está "totalmente de acordo com a letra e o espírito da lei de direitos autorais". No entanto, qual será a opinião dos criadores de conteúdo sobre essa afirmação?

Destaques:
📹 A Nvidia secretamente coletou uma grande quantidade de dados de vídeo do YouTube para treinamento de IA, levantando preocupações legais e éticas.
💻 E-mails internos mostram que executivos da Nvidia consideram essa ação totalmente aprovada, demonstrando uma atitude bastante ousada.
📜 O Google aponta que o uso não autorizado de dados do YouTube é uma clara violação dos termos de serviço da plataforma, e a resposta da Nvidia gera controvérsia.

Notícias e Informações de IA

Nvidia acusada de coletar secretamente dados de vídeos do YouTube para treinar IA

AIbase基地