IDEFIX: Un nuevo modelo de IA multimodal de código abierto

La empresa de IA Hugging Face ha lanzado recientemente IDEFIX, un modelo de IA multimodal de código abierto. IDEFIX puede procesar imágenes y texto como entrada y generar texto coherente como salida.

IDEFIX se basa en el modelo de lenguaje visual Flamingo y se entrenó utilizando una variedad de conjuntos de datos abiertos, incluyendo Wikipedia, conjuntos de datos multimodales públicos y LAION. En comparación con los modelos propietarios, IDEFIX muestra un rendimiento excepcional en diversas evaluaciones de comprensión de texto e imagen.

Esto representa un avance significativo en los modelos de IA multimodal de código abierto.