MiniGPT-5
Modèle multimodal pour la génération d'images et de texte
Produit OrdinaireProgrammationNLPCV
MiniGPT-5 est une technologie de génération visuelle linguistique entrelacée basée sur des jetons génératifs, capable de générer simultanément une description textuelle et l'image correspondante. Il adopte une stratégie d'entraînement en deux phases : une première phase d'entraînement multimodal sans description, et une seconde phase d'apprentissage multimodal. Ce modèle a obtenu de bons résultats sur les tâches de génération de dialogues multimodaux.
MiniGPT-5 Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34