Aria-UI
Modèle multi-modal pour la localisation visuelle d'instructions GUI
Produit OrdinaireProductivitéLocalisation visuelleModèle multi-modal
Aria-UI est un modèle multi-modal à grande échelle conçu pour la localisation visuelle d'instructions GUI. Il utilise une approche purement visuelle, sans recourir à des entrées auxiliaires, et s'adapte à des instructions de planification variées. Il génère des exemples d'instructions diversifiés et de haute qualité pour s'adapter à différentes tâches. Aria-UI a établi de nouveaux records dans les tests de référence d'agents hors ligne et en ligne, surpassant les références basées uniquement sur la vision et celles utilisant AXTree.
Aria-UI Dernière situation du trafic
Nombre total de visites mensuelles
77
Taux de rebond
49.75%
Nombre moyen de pages par visite
1.0
Durée moyenne de la visite
00:00:00