Kosmos-2
Modelo de lenguaje grande multi-modal orientado al mundo
Producto ComúnProductividadProcesamiento del Lenguaje NaturalMultimodal
Kosmos-2 es un modelo de lenguaje grande multimodal que puede relacionar el lenguaje natural con entradas de diversas formas, como imágenes y videos. Se puede utilizar en tareas como localización de frases, comprensión de referencias, generación de referencias, descripción de imágenes y preguntas y respuestas visuales. Kosmos-2 utiliza el conjunto de datos GRIT, que contiene una gran cantidad de pares imagen-texto, que se pueden utilizar para el entrenamiento y la evaluación del modelo. La ventaja de Kosmos-2 radica en su capacidad para relacionar el lenguaje natural con la información visual, lo que mejora el rendimiento del modelo.
Kosmos-2 Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34