A plataforma de IA aberta da Zhipu anunciou recentemente que o modelo GLM-4-Flash está oficialmente disponível gratuitamente para o público. Os usuários precisam apenas se registrar em bigmodel.cn para construir modelos e aplicativos exclusivos gratuitamente. Essa medida deve impulsionar uma nova onda de inovação na área de aplicativos de IA.
O modelo GLM-4-Flash é conhecido por sua alta velocidade e economia, sendo especialmente adequado para tarefas simples que exigem resposta rápida. O modelo suporta conversas de várias rodadas, navegação na web, Function Call e raciocínio de texto longo, cobrindo 26 idiomas, incluindo chinês, inglês, japonês, coreano, alemão, etc. Seus cenários de aplicação são amplos, incluindo pré-processamento de dados de pesquisa, extração de informações, tradução multilíngue e conversas de várias rodadas.
Em termos técnicos, o GLM-4-Flash otimizou a eficiência operacional por meio de quantização adaptativa de peso, paralelismo, estratégias de processamento em lote e amostragem especulativa, reduzindo significativamente o custo de inferência. Na fase de pré-treinamento, foram usados dados selecionados por modelos de linguagem grandes, obtendo mais de 10T de dados multilíngues de alta qualidade, mais de três vezes o modelo ChatGLM3-6B. Simultaneamente, a aplicação da tecnologia FP8 melhorou significativamente a eficiência do pré-treinamento.
Em termos de desempenho, o GLM-4-Flash apresentou excelente desempenho em testes de capacidade de raciocínio lógico, atingindo uma velocidade de geração de 72,14 tokens/s (cerca de 115 caracteres/s), ficando atrás apenas do GPT-3.5-turbo. Além disso, o modelo possui capacidade de pesquisa na web em tempo real, podendo acessar rapidamente informações como clima e notícias. Sua capacidade de chamada de função é comparável à do GPT-4.
As aplicações do GLM-4-Flash já demonstraram potencial em diversas áreas. Biólogos o utilizam para processar dados moleculares e explorar códigos de saúde; desenvolvedores o utilizam para gerar dados de treinamento, auxiliando no crescimento de outros grandes modelos; acadêmicos universitários o utilizam para criar assistentes de IA, melhorando a experiência de aprendizagem; desenvolvedores de aplicativos de tradução o utilizam para desenvolver ferramentas de aprendizagem interativa de inglês para crianças; e agências de publicidade o utilizam para aprimorar textos, aumentando a eficiência da redação.
Para incentivar o feedback do usuário, a plataforma aberta de IA da Zhipu também lançou um benefício de ajuste fino gratuito por tempo limitado: ao concluir um questionário, você receberá um pacote de recursos de treinamento de 5 milhões de Tokens (3 meses). Vagas limitadas, primeiro a chegar, primeiro a ser atendido.
Endereço de experiência: https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash