Le modèle IA multimodale open-source IDEFIX

La startup d'intelligence artificielle Hugging Face a récemment lancé IDEFIX, un modèle d'IA multimodale open-source. IDEFIX peut traiter des entrées d'images et de texte et générer des sorties textuelles cohérentes.

IDEFIX est basé sur le modèle de langage visuel Flamingo et a été entraîné sur divers ensembles de données ouvertes, notamment Wikipédia, des ensembles de données multimodales publiques et LAION.

Comparé aux modèles propriétaires, IDEFIX offre des performances exceptionnelles dans diverses évaluations de compréhension d'image et de texte. Ceci marque une avancée significative pour les modèles d'IA multimodale open-source.