Am 23. Januar 2025 wurde das weltweit erste öffentlich zugängliche, sofort einsatzbereite Computer-Intelligenzsystem GLM-PC aktualisiert und hat große Aufmerksamkeit erregt. GLM-PC basiert auf dem multimodalen KI-Modell CogAgent von Zhipu und kann wie ein Mensch den Computer „beobachten“ und „bedienen“, um Benutzer bei der effizienten Erledigung verschiedener Computeraufgaben zu unterstützen.
Seit der Veröffentlichung von GLM-PC v1.0 am 29. November 2024 und der Öffnung der internen Tests wurde das intelligente System kontinuierlich optimiert und aktualisiert. Der kürzlich eingeführte „Tiefen Denk“-Modus erweitert die Funktionen um logisches Schließen und Codegenerierung, wodurch GLM-PC komplexe Aufgaben noch besser bewältigen kann. Darüber hinaus unterstützt GLM-PC jetzt auch Windows, wodurch sich die Anwendungsszenarien erweitern.
Das Architekturdesign von GLM-PC berücksichtigt die Verbesserung der Modellfähigkeiten und die Optimierung der Kooperationsarchitektur von Agenten. Ein vollständiger Agent muss auf der Wahrnehmungsebene multimodale Signale wie Text, Bilder, Videos und Audio empfangen; auf der Denkebene logisches Denken, Aufgabenplanung sowie effiziente Wahrnehmung und flexible Bedienfähigkeit besitzen; und auf der Ausführungsebene die vollständige GUI-Steuerung durchführen, Umgebungsrückmeldungen empfangen und sich selbst korrigieren können. GLM-PC orientiert sich an der Arbeitsteilung zwischen „linker“ und „rechter Gehirnhälfte“ des Menschen und verbindet durch Codegenerierung und grafische Benutzeroberfläche-Verständnis logisches Schließen und Wahrnehmungserkennung, wodurch ein Gleichgewicht zwischen Logik und Kreativität geschaffen wird.
In der Praxis zeigt GLM-PC leistungsstarke Funktionen. Die „linke Gehirnhälfte“ ist für strenge logische Schlussfolgerungen und Aufgabenabwicklung zuständig und kann schnell detaillierte Aufgabenplanungspläne erstellen und durch einen iterativen Ausführungsmechanismus die präzise Ausführung und hohe Automatisierung der Aufgaben gewährleisten. Beispielsweise kann GLM-PC automatisch Produktdaten aus Bildern extrahieren, in Excel speichern und die Produkte automatisch dem Warenkorb auf Taobao hinzufügen, um einen durchgängigen Einkaufsprozess zu ermöglichen. Die „rechte Gehirnhälfte“ konzentriert sich auf tiefe Wahrnehmung und Interaktion und kann grafische Benutzeroberflächenelemente genau erkennen, Benutzerverhalten verstehen, komplexe Bilder tiefgehend semantisch analysieren und Bild- und Textinformationen zu einem umfassenden Wahrnehmungsergebnis verschmelzen. Dies ermöglicht GLM-PC eine hervorragende Leistung bei der Datenaufbereitung und Informationsgewinnung.
Erwähnenswert ist auch die leistungsstarke Zusammenarbeit zwischen linker und rechter Gehirnhälfte von GLM-PC. Bei der Bearbeitung komplexer logischer Aufgaben kann GLM-PC bei offenen Fragen eine höhere Anpassungsfähigkeit, Kreativität und Generalisierungsfähigkeit zeigen. Durch dynamische Optimierung und Situationserkennung kann GLM-PC Benutzern helfen, effizientere Lösungen zu finden, insbesondere bei der Bearbeitung von iterativen Aufgaben, der Ausführung mehrstufiger Schlussfolgerungen und der Verwaltung von langkettigen Aufgaben.
Darüber hinaus fördert Zhipu aktiv die Zusammenarbeit von GLM-PC mit bekannten PC-Herstellern, um gemeinsam Innovationen und die Entwicklung von AIPC (KI-Personalcomputer) voranzutreiben. AIPC ist nicht nur ein Computer, sondern auch eine neue Anwendung von KI-Agenten im Bereich des persönlichen Computings, die Benutzern ein effizienteres und intelligenteres Arbeits- und Lebenserlebnis bietet.
Download & Testversion:https://cogagent.aminer.cn