CogAgent-9B-20241220
CogAgent-9B-20241220は、視覚言語モデルに基づくGUIエージェントモデルです。
一般製品プログラミング視覚言語モデルGUIエージェント
CogAgent-9B-20241220モデルは、GLM-4V-9B双言語オープンソースVLM基礎モデルに基づいており、データ収集と最適化、多段階トレーニング、戦略改善を通じて、GUI認識、推論予測精度、動作空間の完全性、タスクの汎化性において顕著な進歩を遂げました。このモデルは双言語(中国語と英語)のインタラクションをサポートし、スクリーンショットと言語入力を処理できます。このバージョンは既にZhipuAIのGLM-PC製品に適用されており、視覚言語モデルに基づくGUIエージェントの研究と応用を推進することを目的としています。
CogAgent-9B-20241220 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44