2025年1月23日、世界初の一般公開向け、すぐに使えるコンピューターインテリジェントエージェントGLM-PCが再びアップデートされ、大きな注目を集めています。GLM-PCは、智譜多モーダル大規模モデルCogAgentをベースにしており、人間のようにコンピューターを「観察」し「操作」することで、ユーザーが様々なコンピュータータスクを効率的に完了するのを支援します。

2024年11月29日にGLM-PC v1.0がリリースされ、クローズドベータテストが開始されて以来、このインテリジェントエージェントは継続的に最適化とアップデートが行われています。「深層思考」モードの最新アップデートでは、論理推論とコード生成機能が追加され、GLM-PCは複雑なタスク処理においてより使いやすくなりました。さらに、Windowsシステムのサポートも実現し、適用範囲がさらに広がりました。

微信截图_20250123140726.png

GLM-PCのアーキテクチャ設計は、エージェントのモデル能力の向上と協調アーキテクチャの最適化を十分に考慮しています。完全なエージェントは、知覚レベルでテキスト、画像、ビデオ、音声などの多様な信号を受信し、思考レベルで論理的思考、タスク計画能力、効率的な知覚、柔軟な操作能力を備え、実行レベルでGUI空間全体を操作し、環境からのフィードバックを受け取り、自己修正を行う必要があります。GLM-PCは人間の「左脳」と「右脳」の分業を参考に、コード生成とグラフィカルユーザーインターフェースの理解を通じて、論理推論と知覚認識を深く融合させ、論理性と創造性のバランスを実現しています。

実際の応用において、GLM-PCは強力な機能を示しています。「左脳」は厳密な論理推論とタスク実行を担当し、詳細なタスク計画案を迅速に策定し、循環実行メカニズムを通じてタスクの正確な実行と高度な自動化を保証します。例えば、GLM-PCは画像から商品データを自動的に抽出し、Excelに保存し、商品を淘宝のショッピングカートに自動的に追加することで、ワンストップショッピングを実現します。「右脳」は深層知覚とインタラクション体験に焦点を当て、グラフィカルユーザーインターフェース要素を正確に認識し、ユーザーの行動を理解し、複雑な画像に対して深い意味解析を行い、画像とテキスト情報を融合して包括的な知覚結果を形成します。これにより、GLM-PCはデータ整理、情報抽出において優れた性能を発揮します。

特筆すべきは、GLM-PCが左右脳協調の強力な能力を示していることです。複雑な論理タスクを処理する一方で、GLM-PCは開放的な問題においても高い適応能力、創造性、汎化能力を発揮します。動的な最適化と状況認識を通じて、GLM-PCはユーザーがより効率的な解決策を探求するのを支援し、特に循環タスク処理、複数ステップの推論実行、長鎖タスク管理において効果を発揮します。

さらに、智譜はGLM-PCと著名なPCメーカーとの協力を積極的に推進し、AIPC(AIパーソナルコンピューター)の革新と発展を共同で推進しています。AIPCは単なるコンピューターではなく、AIエージェントによるパーソナルコンピューティング分野における新たな応用であり、ユーザーにより効率的でインテリジェントな仕事と生活体験を提供します。

ダウンロード&体験:https://cogagent.aminer.cn