En uno de los casos de derechos de autor de inteligencia artificial en curso contra Meta, Kadrey v. Meta, los mensajes internos publicados por el tribunal revelan una feroz competencia y posibles problemas de derechos de autor en el desarrollo de Llama3. Los altos directivos e investigadores de Meta se esforzaron al máximo para superar a empresas como OpenAI y Anthropic en el desarrollo de modelos de IA, considerando sus GPT-4 y Claude como el estándar de oro a alcanzar.
Una mentalidad de competencia feroz: Meta jura vencer a OpenAI
Según Ahmad Al-Dahle, vicepresidente de IA generativa de Meta, el objetivo en el desarrollo de Llama3 estaba claramente dirigido a GPT-4, decididos a obtener una ventaja en la competencia de IA mediante el soporte de hardware eficiente, como las GPU de 64k. Al-Dahle escribió en un mensaje interno: "¡Lanzaremos GPU de 64k! Necesitamos aprender a construir la vanguardia y ganar esta carrera."
Sin embargo, a pesar del lanzamiento de modelos de IA de código abierto por parte de Meta, los ejecutivos de Meta se centraron más en superar a competidores que normalmente no hacen públicos los pesos de sus modelos, como OpenAI y Anthropic, que mantienen sus modelos bajo una API, creando un fuerte enfoque competitivo.
El desprecio por Mistral y la ansiedad interna
La startup francesa de inteligencia artificial Mistral es uno de los mayores competidores públicos de Meta, pero los altos directivos de Meta parecen menospreciarla. En un mensaje, Al-Dahle dijo: "Mistral es insignificante para nosotros, deberíamos poder hacerlo mejor". Esto también revela la extrema ansiedad interna de Meta sobre la competencia de IA y su fuerte ambición en la industria.
Simultáneamente, los líderes de IA de Meta discutieron con frecuencia en comunicaciones internas cómo estaban obteniendo datos activamente para entrenar Llama3, y cierta información indica que los ejecutivos tenían grandes expectativas para Llama3; un ejecutivo incluso mencionó en un mensaje: "Llama3 es lo único que realmente me importa."
Problemas de derechos de autor y desafíos legales
Con la feroz competencia que Meta enfrentó durante el desarrollo de Llama3, los datos de entrenamiento utilizados también comenzaron a generar controversia legal. Los fiscales alegan que los ejecutivos de Meta, en su afán por alcanzar rápidamente el desarrollo de IA, podrían haber tomado atajos y utilizado libros protegidos por derechos de autor como datos de entrenamiento.
En un mensaje, el investigador Hugo Touvron reveló que la combinación de conjuntos de datos utilizada en el entrenamiento de Llama2 era "mala" y sugirió optimizar Llama3 mejorando los conjuntos de datos. También discutieron cómo superar los obstáculos para usar el conjunto de datos LibGen, que incluye obras con derechos de autor de editores como Cengage Learning, Macmillan Learning, McGraw Hill y Pearson Education.
A pesar de los problemas de derechos de autor, el CEO de Meta, Mark Zuckerberg, enfatizó que Meta continuará impulsando el progreso de los modelos Llama y reducirá la brecha con otros modelos cerrados como OpenAI y Google.
Perspectivas futuras de Meta y la posición de mercado de Llama3
En julio de 2024, Zuckerberg declaró que Llama3 ya era comparable en rendimiento a los modelos de IA más avanzados y que incluso los superaba en algunas áreas. Predijo que, a partir de 2025, la serie Llama de Meta se convertiría en el modelo de IA más avanzado del sector. Sin embargo, el lanzamiento de Llama3 aún debe hacer frente a las crecientes demandas por derechos de autor, especialmente el escrutinio legal de sus datos de entrenamiento.