Série GLM-Edge: modelos de linguagem e multimodais de ponta abertos pela ZhiPu AI

AIbase基地

Publicado emNotícias e Informações de IA · 3 minutos de leitura · Nov 30, 2024

279

A Zhihu Technology anunciou recentemente a disponibilização em código aberto de sua série de modelos de linguagem ampla e multimodais para dispositivos finais, GLM-Edge. Este movimento representa uma tentativa significativa da empresa em cenários de uso real em dispositivos finais.

Inteligência Artificial Zhihu

Com base na experiência acumulada com a série GLM-4, a equipe de pesquisa da Zhihu ajustou a estrutura e o tamanho do modelo para alcançar o melhor equilíbrio entre desempenho do modelo, resultados de inferência em dispositivos reais e facilidade de implantação. Através da colaboração aprofundada com parceiros e otimização de inferência, os modelos da série GLM-Edge demonstraram velocidades de execução excepcionais em algumas plataformas de dispositivos finais. Especificamente na plataforma Qualcomm Snapdragon 8 Elite, com o auxílio da capacidade de processamento da NPU e da solução de quantização mista, o modelo de diálogo de 1,5B e o modelo multimodais de 2B conseguem atingir uma velocidade de decodificação superior a 60 tokens por segundo. Ao utilizar a técnica de amostragem especulativa, a velocidade de decodificação pode chegar a mais de 100 tokens por segundo.

A disponibilização em código aberto dos modelos da série GLM-Edge pela Zhihu não apenas demonstra a força tecnológica da empresa na área de inteligência artificial, mas também fornece aos desenvolvedores e pesquisadores ferramentas e recursos poderosos para promover o desenvolvimento e a inovação de aplicativos de IA em dispositivos finais.

Coleção GLM-Edge:

https://modelscope.cn/collections/GLM-Edge-ff0306563d2844

CSN Steel integra com sucesso o modelo de linguagem grande DeepSeek-R1, impulsionando a transformação digital

A CSN Steel deu um passo importante em sua jornada de transformação digital, anunciando recentemente em sua plataforma de interação a integração bem-sucedida do modelo de linguagem grande DeepSeek-R1. A empresa afirmou que, no futuro, se dedicará a promover a profunda integração entre tecnologia digital e economia real, usando isso como base para reformas abrangentes, buscando acelerar a construção de ativos de dados e explorar o valor potencial dos dados. Os esforços da CSN Steel para promover a manutenção inteligente representam uma estratégia crucial em um mercado competitivo. Com a integração do modelo de linguagem grande DeepSeek-R1, o 'Mensageiro CSN Steel'...

Ultrapassando o DeepSeek-R1! O modelo de linguagem grande Wanxiang da Alibaba assume a liderança no ranking global de código aberto

De acordo com o ranking mais recente divulgado pela comunidade de código aberto Hugging Face, o modelo de linguagem grande Wanxiang, lançado pela Alibaba, ultrapassou o DeepSeek-R1 apenas seis dias após seu lançamento em código aberto, assumindo a liderança em duas importantes listas de classificação: ranking de modelos populares e ranking de espaço de modelos. Essa conquista não apenas demonstra o desempenho técnico excepcional do modelo de linguagem grande Wanxiang, mas também reflete seu amplo reconhecimento e influência na comunidade global de código aberto.

Assistente de IA Xiao Ai da Xiaomi agora integrado com o modelo de linguagem grande DeepSeek R1

Os usuários agora podem ativar o DeepSeek-R1 dizendo "Ativar DeepSeek" para o Xiao Ai, para desfrutar de recursos como codificação, escrita e raciocínio lógico. Embora a Xiaomi ainda não tenha feito um anúncio oficial, a compatibilidade do Xiao Ai já foi confirmada em mais de 25 modelos de smartphones Xiaomi e Redmi.

Notícias e Informações de IA

Série GLM-Edge: modelos de linguagem e multimodais de ponta abertos pela ZhiPu AI

AIbase基地

Notícias de IA Relacionadas Recomendadas

Em apenas quatro semanas! A Foxconn lança o modelo de linguagem grande em chinês FoxBrain

CSN Steel integra com sucesso o modelo de linguagem grande DeepSeek-R1, impulsionando a transformação digital

Ultrapassando o DeepSeek-R1! O modelo de linguagem grande Wanxiang da Alibaba assume a liderança no ranking global de código aberto

Assistente de IA Xiao Ai da Xiaomi agora integrado com o modelo de linguagem grande DeepSeek R1