MiniGPT-5
Modelo multimodal para la generación de imágenes y lenguaje
Producto ComúnProgramaciónPNLCV
MiniGPT-5 es una tecnología de generación visual-lingüística entrelazada basada en tokens generativos, capaz de generar simultáneamente descripciones de texto e imágenes relacionadas. Emplea una estrategia de entrenamiento en dos fases: la primera, un entrenamiento de generación multimodal sin descripción; y la segunda, un aprendizaje multimodal. El modelo ha obtenido buenos resultados en tareas de generación de diálogos multimodales.
MiniGPT-5 Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34