Emu3
Modelo inteligente multimodal de próxima generación
Selección NacionalProductividadMultimodalGeneración de imágenes
Emu3 es un modelo multimodal de última generación entrenado únicamente mediante la predicción del siguiente token, capaz de procesar imágenes, texto y vídeo. Supera a varios modelos insignia de tareas específicas en tareas de generación y percepción, sin necesidad de arquitecturas de difusión o combinadas. Emu3 simplifica el diseño de modelos multimodales complejos mediante la unificación de secuencias multimodales en un único modelo Transformer, demostrando un enorme potencial de escalabilidad en el entrenamiento y la inferencia.
Emu3 Situación del tráfico más reciente
Total de visitas mensuales
951
Tasa de rebote
63.33%
Páginas promedio por visita
1.4
Duración promedio de la visita
00:00:04