CogAgent

Agent GUI basé sur un modèle linguistique visuel (VLM) open source de bout en bout

Produit OrdinaireProgrammationModèle linguistique visuelAgent GUI
CogAgent est un agent GUI basé sur un modèle linguistique visuel (VLM). Il permet une interaction bilingue (chinois et anglais) via des captures d'écran et du langage naturel. CogAgent a réalisé des progrès significatifs en termes de perception de l'interface graphique, de précision des prédictions d'inférence, d'exhaustivité de l'espace d'action et de généralisation des tâches. Ce modèle est déjà utilisé dans le produit GLM-PC de ZhipuAI, visant à aider les chercheurs et les développeurs à faire progresser la recherche et les applications des agents GUI basés sur des modèles linguistiques visuels.
Ouvrir le site Web

CogAgent Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

CogAgent Tendance des visites

CogAgent Distribution géographique des visites

CogAgent Sources de trafic

CogAgent Alternatives