Na área de inteligência artificial, o problema de "alucinação" em grandes modelos de linguagem tem sido um desafio crucial para a indústria. Recentemente, os resultados de um teste baseado no sistema de avaliação HHEM-2.1-Open mostraram que o modelo GLM-4-9B da Zhihu AI apresentou resultados notáveis.

Os dados do teste mostram que, entre os 85 grandes modelos de linguagem avaliados, o GLM-4-9B conquistou o primeiro lugar com uma taxa de consistência de fatos de 98,7% e uma taxa de resposta de 100%. É particularmente digno de nota que a taxa de alucinação do modelo seja apenas de 1,3%, um resultado que não apenas ocupa o primeiro lugar, mas também supera os modelos da série GPT da OpenAI e da série Gemini do Google.

Robô, Metaverso, Ficção Científica

Observação da fonte da imagem: A imagem foi gerada por IA, fornecida pela Midjourney.

Este resultado inovador marca um avanço significativo para os grandes modelos de linguagem chineses na redução da "taxa de alucinação", abrindo novas possibilidades para melhorar a confiabilidade e precisão dos aplicativos de IA. Isso não apenas demonstra a força técnica da Zhihu AI no desenvolvimento de modelos, mas também estabelece um novo padrão para o campo global de IA.

No contexto da crescente competição tecnológica de IA, o excelente desempenho do modelo GLM-4-9B certamente atrairá mais atenção para a Zhihu AI e também proporcionará às empresas chinesas de IA maior poder de voz no cenário internacional.