Em 23 de janeiro de 2025, o GLM-PC, o primeiro agente inteligente de computador do mundo voltado para o público e pronto para uso, recebeu uma nova atualização, gerando grande interesse. Baseado no modelo multimodal CogAgent da Zhipu, o GLM-PC pode "observar" e "operar" um computador como um humano, auxiliando os usuários a concluir tarefas de computador de forma eficiente.
Desde o lançamento do GLM-PC v1.0 em 29 de novembro de 2024 e a abertura do teste interno, este agente inteligente tem sido continuamente otimizado e atualizado. O mais recente modo "Pensamento Profundo" adicionou recursos de raciocínio lógico e geração de código, tornando o GLM-PC mais eficiente no tratamento de tarefas complexas. Além disso, o GLM-PC agora suporta sistemas Windows, expandindo ainda mais seus cenários de aplicação.
O design de arquitetura do GLM-PC considera cuidadosamente a melhoria da capacidade do modelo do agente e a otimização da arquitetura de colaboração. Um agente completo deve atender aos seguintes requisitos: no nível de percepção, receber sinais multimodais como texto, imagens, vídeos e áudio; no nível de pensamento, possuir raciocínio lógico, capacidade de planejamento de tarefas e capacidade de percepção eficiente e operação flexível; e no nível de execução, ser capaz de realizar operações completas no espaço da GUI, receber feedback do ambiente e se autocorrigir. O GLM-PC utiliza a analogia da divisão de trabalho entre o "cérebro esquerdo" e o "cérebro direito" humanos, combinando a geração de código e a compreensão da interface gráfica para alcançar uma combinação profunda de raciocínio lógico e cognição perceptiva, dando-lhe a capacidade de equilibrar lógica e criatividade.
Na aplicação prática, o GLM-PC demonstrou capacidades poderosas. Seu "cérebro esquerdo" é responsável pelo raciocínio lógico rigoroso e pela execução de tarefas, podendo elaborar rapidamente planos de tarefas detalhados e garantir a execução precisa e a alta automação das tarefas por meio de um mecanismo de execução cíclica. Por exemplo, o GLM-PC pode extrair automaticamente dados de produtos de imagens, armazená-los no Excel e adicionar automaticamente os produtos ao carrinho de compras do Taobao, realizando um processo de compra completo. Seu "cérebro direito" concentra-se na percepção profunda e na experiência interativa, podendo identificar com precisão elementos da interface gráfica, compreender o comportamento do usuário, realizar uma análise semântica profunda de imagens complexas e integrar informações de imagens e texto para formar resultados de percepção abrangentes. Isso torna o GLM-PC excelente na organização de dados e na extração de informações.
Vale mencionar que o GLM-PC também demonstra a poderosa capacidade de colaboração entre os hemisférios cerebrais. Ao lidar com tarefas lógicas complexas, o GLM-PC também pode mostrar maior adaptabilidade, criatividade e capacidade de generalização em questões abertas. Por meio da otimização dinâmica e da percepção contextual, o GLM-PC pode ajudar os usuários a explorar soluções mais eficientes, especialmente no processamento de tarefas cíclicas, na execução de raciocínio de várias etapas e na gestão de tarefas de longa cadeia.
Além disso, a Zhipu está promovendo ativamente a cooperação entre o GLM-PC e fabricantes de PCs conhecidos, impulsionando conjuntamente a inovação e o desenvolvimento de AIPC (computadores pessoais com IA). O AIPC não é apenas um computador, mas também um novo aplicativo de agentes de IA no campo da computação pessoal, capaz de fornecer aos usuários uma experiência de trabalho e vida mais eficiente e inteligente.
Download & Experiência:https://cogagent.aminer.cn