CogAgent

Agente GUI basado en el modelo de lenguaje visual de extremo a extremo (VLM) de código abierto

Producto ComúnProgramaciónModelo de lenguaje visualAgente GUI
CogAgent es un agente GUI basado en un modelo de lenguaje visual (VLM) que permite la interacción bilingüe (chino e inglés) a través de capturas de pantalla y lenguaje natural. CogAgent ha logrado avances significativos en la percepción de la GUI, la precisión de la predicción de inferencia, la integridad del espacio de operación y la generalización de tareas. Este modelo ya se ha aplicado en el producto GLM-PC de ZhipuAI, con el objetivo de ayudar a investigadores y desarrolladores a impulsar la investigación y la aplicación de agentes GUI basados en modelos de lenguaje visual.
Abrir sitio web

CogAgent Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

CogAgent Tendencia de visitas

CogAgent Distribución geográfica de las visitas

CogAgent Fuentes de tráfico

CogAgent Alternativas