Documentos judiciais mostram obsessão de executivos do Meta em superar o GPT-4 do OpenAI internamente

Em um dos casos de direitos autorais de inteligência artificial em andamento contra o Meta, Kadrey v. Meta, mensagens internas divulgadas pelo tribunal revelam a intensa competição e potenciais problemas de direitos autorais enfrentados pela empresa durante o desenvolvimento do Llama3. Líderes e pesquisadores de alto escalão do Meta se esforçaram ao máximo para superar empresas como OpenAI e Anthropic no desenvolvimento de modelos de IA, considerando seus modelos GPT-4 e Claude como o padrão ouro a ser alcançado.

Mentalidade Competitiva Intensa: Meta Jura Derrotar a OpenAI

De acordo com Ahmad Al-Dahle, vice-presidente de IA generativa do Meta, o objetivo da empresa no desenvolvimento do Llama3 era claramente o GPT-4, e a empresa estava determinada a obter uma vantagem na competição de IA por meio de suporte de hardware eficiente, como GPUs de 64k. Em uma mensagem interna, Al-Dahle escreveu: “Vamos lançar a GPU de 64k! Precisamos aprender como construir a vanguarda e vencer esta corrida.”

No entanto, apesar do lançamento de modelos de IA de código aberto pelo Meta, os executivos do Meta estavam mais focados em superar os concorrentes que geralmente não divulgam os pesos de seus modelos, como OpenAI e Anthropic, que colocam seus modelos atrás de APIs, criando um foco competitivo intenso.

Metaverso Facebook meta

Desprezo por Mistral e Ansiedade Interna

A startup francesa de inteligência artificial Mistral é um dos maiores concorrentes públicos do Meta, mas os executivos do Meta aparentemente a desprezam. Em uma mensagem, Al-Dahle disse: “A Mistral é insignificante para nós, deveríamos ser capazes de fazer melhor.” Isso também expõe a extrema ansiedade interna do Meta em relação à competição de IA e sua forte ambição no setor.

Ao mesmo tempo, os líderes de IA do Meta discutiram frequentemente em comunicações internas como eles estavam ativamente adquirindo dados para treinar o Llama3, e algumas informações sugerem que os executivos estavam muito animados com o Llama3, com um executivo até mesmo mencionando em uma mensagem: “O Llama3 é tudo o que realmente me importa.”

Problemas de Direitos Autorais e Desafios Legais

Com a intensa competição enfrentada pelo Meta durante o desenvolvimento do Llama3, os dados de treinamento usados também começaram a gerar controvérsias legais. Os promotores alegam que os executivos do Meta podem ter cortado cantos e usado livros protegidos por direitos autorais como dados de treinamento enquanto corriam para acompanhar o progresso do desenvolvimento de IA.

Em uma mensagem, o pesquisador Hugo Touvron revelou que a combinação de conjuntos de dados usados no treinamento do Llama2 era “muito ruim” e sugeriu otimizar o Llama3 melhorando os conjuntos de dados. Eles também discutiram como superar os obstáculos para usar o conjunto de dados LibGen, que inclui obras protegidas por direitos autorais de editoras como Cengage Learning, Macmillan Learning, McGraw Hill e Pearson Education.

Apesar dos problemas de direitos autorais, o CEO do Meta, Mark Zuckerberg, enfatizou que o Meta continuará a impulsionar o progresso dos modelos Llama e a reduzir a diferença em relação a outros modelos fechados, como OpenAI e Google.

Perspectivas Futuras do Meta e Posição de Mercado do Llama3

Em julho de 2024, Zuckerberg disse que o Llama3 já se igualava em desempenho aos modelos de IA mais avançados e até mesmo os superava em algumas áreas. Ele previu que, a partir de 2025, a série Llama do Meta se tornaria a mais avançada do setor. No entanto, o lançamento do Llama3 ainda precisa lidar com os processos judiciais de direitos autorais cada vez mais intensos, especialmente a revisão legal de seus dados de treinamento.

Notícias e Informações de IA

Documentos judiciais mostram obsessão de executivos do Meta em superar o GPT-4 do OpenAI internamente

AIbase基地

Notícias de IA Relacionadas Recomendadas

Apresentado como o OCR mais poderoso do mundo! Análise completa da nova API OCR da Mistral

Quantexa arrecada US$ 175 milhões, atingindo avaliação de US$ 2,6 bilhões, impulsionando negócios de análise de dados e IA

CoreWeave adquire a plataforma de desenvolvimento de IA Weights&Biases para acelerar a inovação em inteligência artificial

Estudo de Stanford revela: adoção de ferramentas de escrita de IA é mais rápida em regiões com baixa escolaridade