A Zhihu anunciou o lançamento da série de modelos GLM-4-9B, incluindo modelos base, modelos de bate-papo com diferentes comprimentos de contexto e modelos visuais, com capacidades que superam o LLaMA38B. Segundo informações, a série de modelos GLM-4-9B já foi lançada em código aberto no Github, atraindo a atenção de muitos desenvolvedores e pesquisadores. O lançamento desta série de modelos é considerado mais um avanço importante da Zhihu na área da inteligência artificial.

image.png

O GLM-4-9B é a versão de código aberto da mais recente geração de modelos pré-treinados GLM-4 da Zhihu AI. Em avaliações de conjuntos de dados em vários aspectos, como semântica, matemática, raciocínio, código e conhecimento, o GLM-4-9B e sua versão alinhada com preferências humanas, o GLM-4-9B-Chat, demonstraram desempenho superior ao Llama-3-8B.

image.png

Além de realizar diálogos de várias rodadas, o GLM-4-9B-Chat possui recursos avançados como navegação na web, execução de código, chamada de ferramentas personalizadas (Function Call) e raciocínio de texto longo (suporta contexto máximo de 128K).

Esta geração de modelos adicionou suporte para vários idiomas, incluindo 26 idiomas como japonês, coreano e alemão. Também lançamos o modelo GLM-4-9B-Chat-1M, que suporta comprimento de contexto de 1M (cerca de 2 milhões de caracteres chineses), e o modelo multimodal GLM-4V-9B baseado no GLM-4-9B.

O GLM-4V-9B possui capacidade de diálogo multilíngue chinês-inglês em alta resolução de 1120*1120. Em avaliações multimodais em vários aspectos, como capacidade abrangente em chinês e inglês, raciocínio perceptivo, reconhecimento de texto e compreensão de gráficos, o GLM-4V-9B demonstrou desempenho superior ao GPT-4-turbo-2024-04-09, Gemini1.0Pro, Qwen-VL-Max e Claude3Opus.

Os usuários expressaram seu desejo de que a série de modelos GLM-4-9B impulsione o desenvolvimento da tecnologia de inteligência artificial e esperam ver mais produtos inteligentes surgirem. Ao mesmo tempo, eles também expressaram admiração pela força técnica e capacidade de inovação da Zhihu.

Endereço de código aberto: https://github.com/THUDM/GLM-4

Endereço de experiência do modelo: https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary