En el campo de la inteligencia artificial, el problema de las "alucinaciones" en los grandes modelos de lenguaje ha sido un desafío clave para la industria. Recientemente, los resultados de una prueba basada en el sistema de evaluación HHEM-2.1-Open muestran que el modelo GLM-4-9B de la empresa china Zhihu AI ha obtenido resultados impresionantes.
Los datos de la prueba muestran que, de los 85 grandes modelos de lenguaje evaluados, GLM-4-9B obtuvo el primer lugar con una tasa de consistencia de hechos del 98,7% y una tasa de respuesta del 100%. Cabe destacar que su tasa de alucinaciones es solo del 1,3%, un resultado que no solo lo coloca en el primer lugar, sino que también supera a los modelos de la serie GPT de OpenAI y de la serie Gemini de Google.
Nota de la fuente de la imagen: Imagen generada por IA, proveída por Midjourney.
Este avance significativo marca un progreso importante en la reducción de la "tasa de alucinaciones" en los grandes modelos de lenguaje chinos, abriendo nuevas posibilidades para mejorar la fiabilidad y precisión de las aplicaciones de IA. Esto no solo refleja la capacidad tecnológica de Zhihu AI en el desarrollo de modelos, sino que también establece un nuevo estándar para el campo de la IA a nivel mundial.
En el contexto de la creciente competencia en la tecnología de IA, el excelente rendimiento del modelo GLM-4-9B sin duda atraerá más atención a Zhihu AI y otorgará a las empresas de IA chinas una mayor influencia en el escenario internacional.