Show-o
Transformateur unique pour la compréhension et la génération multimodales
Produit OrdinaireImageIntelligence artificielleMultimodalité
Show-o est un modèle de transformateur unique conçu pour la compréhension et la génération multimodales. Il est capable de traiter le sous-titrage d'images, la question-réponse visuelle, la génération d'images à partir de texte, la réparation et l'extension guidées par le texte, ainsi que la génération multimodale hybride. Développé conjointement par le Show Lab de l'Université nationale de Singapour et ByteDance, ce modèle utilise les dernières techniques de deep learning pour comprendre et générer des données multimodales, représentant une avancée majeure dans le domaine de l'intelligence artificielle.
Show-o Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34