Recentemente, uma operação secreta da gigante de tecnologia Nvidia para aquisição de dados foi exposta. De acordo com a reportagem do site 404, a Nvidia tem coletado dados em massa de vídeos do YouTube para treinar seus modelos de inteligência artificial, uma prática que levanta sérias questões legais e éticas.
O relatório indica que a Nvidia está usando esses dados de vídeo para treinar vários modelos de IA, incluindo o modelo de aprendizado profundo Cosmos, algoritmos de direção autônoma, produtos de avatar de IA humana digital e a ferramenta de construção de mundos 3D Omniverse.
Entende-se que a Nvidia adotou várias medidas ocultas para disfarçar sua coleta de dados, usando várias "máquinas virtuais" e alterando constantemente os endereços IP para evitar ser detectada pelo YouTube. Além disso, os criadores de vídeo e a empresa matriz do YouTube, o Google, não autorizaram essa coleta de dados. A comunicação interna da Nvidia mostra que sua estratégia era bastante ousada, com um executivo mencionando em um e-mail que estava construindo uma "fábrica de dados de vídeo" capaz de gerar dados de experiência visual equivalentes a uma vida humana por dia.
Curiosamente, quando os funcionários expressaram preocupações sobre a legalidade e a ética dessa aquisição de dados, a administração demonstrou grande confiança, afirmando que tudo era decisão da alta gerência. O e-mail dizia: "Temos uma aprovação abrangente para todos os dados."
Ainda mais preocupante é que a Nvidia, por um tempo, soube que estava usando um conjunto de dados HD-VG-130M contendo 130 milhões de vídeos do YouTube, originalmente criado para pesquisa acadêmica. Muitos especialistas expressaram forte insatisfação, considerando o uso de dados de pesquisa para fins comerciais uma conduta imprópria.
Como participante central da indústria de IA, a Nvidia ocupa uma posição de destaque no mercado, com suas unidades de processamento gráfico (GPUs) sendo a base de muitos sistemas de IA de uso intensivo de computação. Empresas que trabalham com a Nvidia, como OpenAI, Microsoft e Google, expressaram preocupação com esse comportamento. Um porta-voz do Google mencionou que o uso não autorizado de dados do YouTube é uma clara violação dos termos de serviço da plataforma.
Em resposta à mídia, a Nvidia afirmou que seu treinamento de IA está "totalmente de acordo com a letra e o espírito da lei de direitos autorais". No entanto, qual será a opinião dos criadores de conteúdo sobre essa afirmação?
Destaques:
📹 A Nvidia secretamente coletou uma grande quantidade de dados de vídeo do YouTube para treinamento de IA, levantando preocupações legais e éticas.
💻 E-mails internos mostram que executivos da Nvidia consideram essa ação totalmente aprovada, demonstrando uma atitude bastante ousada.
📜 O Google aponta que o uso não autorizado de dados do YouTube é uma clara violação dos termos de serviço da plataforma, e a resposta da Nvidia gera controvérsia.