Kosmos-2

Modelo de lenguaje grande multi-modal orientado al mundo

Producto ComúnProductividadProcesamiento del Lenguaje NaturalMultimodal
Kosmos-2 es un modelo de lenguaje grande multimodal que puede relacionar el lenguaje natural con entradas de diversas formas, como imágenes y videos. Se puede utilizar en tareas como localización de frases, comprensión de referencias, generación de referencias, descripción de imágenes y preguntas y respuestas visuales. Kosmos-2 utiliza el conjunto de datos GRIT, que contiene una gran cantidad de pares imagen-texto, que se pueden utilizar para el entrenamiento y la evaluación del modelo. La ventaja de Kosmos-2 radica en su capacidad para relacionar el lenguaje natural con la información visual, lo que mejora el rendimiento del modelo.
Abrir sitio web

Kosmos-2 Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

Kosmos-2 Tendencia de visitas

Kosmos-2 Distribución geográfica de las visitas

Kosmos-2 Fuentes de tráfico

Kosmos-2 Alternativas