Meta anuncia el lanzamiento de código abierto de Llama 4, un potente modelo multimodal

AIbase基地

Publicado elNoticias de IA · 4 minutos de lectura · Apr 6, 2025

El gigante tecnológico estadounidense Meta ha lanzado su modelo de inteligencia artificial de código abierto más potente hasta la fecha: Llama4. En esta primera publicación se presentan dos modelos: Llama4Scout y Llama4Maverick.

Llama4Scout cuenta con 109.000 millones de parámetros, 17.000 millones de parámetros activos, 16 expertos y su característica más destacada es la compatibilidad con 10 millones de contextos. Esto equivale a poder procesar más de 20 horas de vídeo y funciona en una sola GPU H100 (después de la cuantificación Int4). En las pruebas de referencia, su rendimiento supera a Gemma3, Gemini2.0Flash - Lite y Mistral3.1.

Llama4Maverick tiene 400.000 millones de parámetros, 17.000 millones de parámetros activos, 128 expertos y 1 millón de contextos. En la clasificación LMSYS de modelos grandes, Llama4Maverick ocupa el segundo lugar (puntuación ELO 1417), solo superado por el modelo propietario Gemini2.5Pro. Con la mitad de parámetros, su capacidad de codificación de inferencia es comparable a la de DeepSeek - v3-0324.

Además, en los próximos meses se lanzará el aún más potente Llama4Behemoth, con 2 billones de parámetros, 288.000 millones de parámetros activos y 16 expertos. Actualmente, en las pruebas de referencia STEM, ya ha superado a GPT-4.5, Claude Sonnet3.7 y Gemini2.0Pro.

La serie Llama4 utiliza por primera vez una arquitectura de expertos mixtos (MoE), que es más eficiente en el entrenamiento y en la respuesta a las consultas de los usuarios. Llama4 también es un modelo multimodal nativo, que utiliza una técnica de fusión temprana para integrar a la perfección los tokens de texto e imagen. Simultáneamente, Meta ha mejorado el codificador visual y ha desarrollado un nuevo método de entrenamiento, MetaP, para optimizar los hiperparámetros. A partir de hoy, los desarrolladores pueden descargar estos dos nuevos modelos en llama.com y Hugging Face.

Puntos clave:
🌟Meta lanza Llama4, un modelo multimodal de código abierto, con Llama4Scout y Llama4Maverick en su lanzamiento inicial, y Llama4Behemoth en el futuro.
💪Llama4 ofrece un rendimiento potente, destacando en las clasificaciones de modelos grandes, con capacidades de codificación de inferencia comparables o superiores a otros modelos excelentes.
🛠️Emplea una arquitectura MoE, es un modelo multimodal nativo, con mejoras tecnológicas y un nuevo método de entrenamiento, disponible para su descarga por los desarrolladores.

Llama4 Llama4Scout Llama4Maverick Meta

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Investigación conjunta de DeepSeek y Tsinghua: Un método innovador de inferencia de modelos de recompensa para mejorar la escalabilidad

Recientemente, investigadores de DeepSeek y Tsinghua publicaron un nuevo artículo que explora métodos de escalamiento para la inferencia de modelos de recompensa, lo que acerca aún más a DeepSeek R2. Actualmente, el aprendizaje por refuerzo se utiliza ampliamente en la fase de entrenamiento posterior a gran escala de los modelos lingüísticos grandes, pero se enfrenta al desafío de obtener señales de recompensa precisas para estos modelos. Los investigadores descubrieron que el uso del modelado generativo de recompensas puntuales (GRM) puede mejorar la capacidad de adaptación del modelo y la escalabilidad en la fase de inferencia. Para ello, propusieron el aprendizaje de Optimización de autoevaluación de principios (SPCT).

Apr 5, 2025

Informe financiero del tercer trimestre de Meta: crecimiento sólido del negocio principal, pero pérdidas de 4400 millones de dólares en el metaverso

Meta (anteriormente Facebook) publicó recientemente su informe financiero del tercer trimestre de 2023. Si bien el negocio principal mostró un excelente desempeño, las enormes pérdidas del departamento del metaverso provocaron preocupación entre los inversores, lo que provocó una caída de más del 3% en el precio de las acciones en las operaciones posteriores al cierre. Este informe financiero muestra la compleja situación de crecimiento de Meta. Los datos muestran que, hasta el 30 de septiembre, los ingresos del tercer trimestre de Meta alcanzaron los 40 600 millones de dólares, un 19% más que el año anterior, superando las expectativas del mercado de 40 300 millones de dólares. Sin embargo, el departamento de Reality Labs, dedicado al metaverso, registró...

Oct 31, 2024

1.8k

¿Conducción autónoma en el metaverso? ¡Juega con la IA de Gigai Tech para una reconstrucción de escenas 4D más fluida!

Recientemente, Gigai Tech propuso un nuevo marco llamado DriveDreamer4D, diseñado para utilizar el conocimiento previo del modelo del mundo para mejorar la reconstrucción de escenas de conducción 4D. Los métodos tradicionales de reconstrucción de escenas 4D se basan principalmente en dos escuelas de pensamiento: NeRF y 3DGS. NeRF es como un súper pintor que utiliza redes neuronales para representar un conjunto de fotografías en un modelo 3D. 3DGS, por otro lado, utiliza un conjunto de funciones gaussianas tridimensionales para simular varios objetos en la escena. Sin embargo, ambos métodos tienen un inconveniente...

Oct 28, 2024

2.6k

Plataforma SaaS de metaverso ligero lanzada por Baidu Xirang, que incluye la plataforma de creación de metaversos de Baidu

La plataforma SaaS de metaverso ligero Baidu Xirang se lanzó oficialmente el 9 de agosto. Se trata de un servicio diseñado específicamente para acelerar la transformación digital de las empresas. Esta plataforma integra la experiencia acumulada de Baidu Xirang en los campos del metaverso, la inteligencia artificial, la computación en la nube y las aplicaciones móviles, ofreciendo la capacidad de suscripción a escenarios ligeros. Mediante la combinación libre de espacios y componentes, permite construir escenarios propios de marketing, exposiciones, medios de comunicación integrados, cultura y educación, ayudando a las empresas a reducir costes y mejorar la eficiencia.

Aug 19, 2024

2.9k

¡Recibe una carta de cese y desistimiento de 28 páginas! La búsqueda de inteligencia artificial de MITAA deja de incluir los metadatos y resúmenes de los documentos de CNKI

Recientemente, el equipo de búsqueda de IA de MITAA recibió una carta de cese y desistimiento de 28 páginas de la Compañía de Publicaciones Electrónicas de Revistas Académicas Chinas (CNKI). La carta indica que la búsqueda de IA de MITAA ha proporcionado a los usuarios una gran cantidad de metadatos y resúmenes de documentos académicos de CNKI sin el permiso de CNKI, una acción que se considera una violación grave de los derechos legítimos de CNKI.

Aug 16, 2024

1.9k

La IA se enfrenta al "desafío mortal": cuando se le pide a un robot que meta un elefante en un refrigerador

Para probar la 'resistencia al estrés' de estas IA, un grupo de investigadores jugó a una 'aventura'. Crearon una prueba llamada Self-Contradictory Instructions (SCI), que es el 'desafío mortal' del mundo de la IA. Esta prueba contiene 20.000 instrucciones contradictorias, que abarcan los campos del lenguaje y la visión. Por ejemplo, se te muestra una foto de un gato, pero se te pide que describas a este 'perro'. ¿No es esto un desafío para las personas? Oh, no, es un desafío para la IA.

Aug 15, 2024

830

Oferta de trabajo revela: Meta busca aprovechar la IA generativa en el metaverso

Meta busca aprovechar la tecnología de inteligencia artificial generativa para crear juegos de realidad virtual, aumentada y mixta, aportando una "nueva forma de jugar" a su metaverso. Recientemente, Meta ofreció un salario anual de 347.000 dólares a un experto para impulsar su visión del metaverso impulsado por IA, mientras que los reguladores han prohibido a Meta el uso de datos personales de brasileños para entrenar su IA.

Jul 3, 2024

1.3k

El modelo de lenguaje grande iFLYTEK Spark se integra en teléfonos móviles para ofrecer servicios de IA y participa en la creación del metaverso de medios de comunicación de CCTV

iFLYTEK anuncia que su modelo de lenguaje grande Spark se integrará en teléfonos móviles para ofrecer servicios de IA. Participa en la creación del metaverso de medios de comunicación de CCTV con la película de animación AI 《千秋诗颂》(Qiānqiū Shīsòng). Se establece la comunidad de investigación y desarrollo del metaverso de medios de comunicación de CCTV. iFLYTEK utiliza la tecnología de inteligencia artificial generativa para impulsar la innovación científica en los medios audiovisuales.

Mar 6, 2024

750

OpenAI integra metadatos C2PA para evitar el uso indebido de imágenes

OpenAI anuncia la integración de metadatos C2PA en las imágenes generadas por ChatGPT y su API para prevenir su uso indebido. C2PA es un estándar de datos abierto que permite rastrear y verificar el origen, la autenticidad y la integridad del contenido digital. Con C2PA, se espera reducir el mal uso de imágenes generadas por IA y mejorar la capacidad de las personas para identificarlas. OpenAI lanza un sitio web para verificar la autenticidad de las imágenes de IA y extenderá esta funcionalidad a todos los usuarios de sus aplicaciones. C2PA fue lanzado por varias empresas líderes de la industria con el objetivo de combatir la desinformación online y mejorar la confianza digital.

Feb 7, 2024

830

Año Nuevo en el metaverso: la Gala de Año Nuevo, ferias de templos y festivales de luces aparecen en el espacio virtual

La tecnología del metaverso aún necesita avances, pero la exploración de la experiencia del metaverso no se detiene. Los programas tradicionales de Año Nuevo Chino para celebrar el Año Nuevo entran en el metaverso, rompiendo las limitaciones geográficas. El Festival de Primavera de Guangdong Television establecerá una subsede en el metaverso, utilizando múltiples tecnologías de vanguardia para crear una experiencia completamente nueva. La Feria del Templo de Beijing en el distrito de Changdian presentará una versión del metaverso, utilizando tecnología digital para mostrar la cultura tradicional. El juego Fortnite lanza un festival de música, donde los jugadores pueden tocar juntos en una banda con sus amigos.

Feb 7, 2024

670

Noticias de IA

IA Diario

Cronología de la IA

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General