Kunlun Wanwei ha anunciado que su modelo de lenguaje propio, TianGong, ha alcanzado una precisión del 80% en la prueba Benchmark GSM8K, superando a GPT-3.5 y LLaMA2-70B, logrando un nivel líder mundial y acercándose al rendimiento de GPT-4. TianGong también ha demostrado un excelente rendimiento en varios conjuntos de datos como MMLU, C-EVAL y HumanEval, con tasas de precisión superiores a otros modelos de lenguaje grandes.
La capacidad de razonamiento de TianGong supera a GPT-3.5 y LLaMA2-70B. En comparación con GPT-3.5, TianGong presenta soluciones más sencillas y claras. Actualmente, TianGong se encuentra en fase de prueba interna y continuará mejorando sus capacidades técnicas para ofrecer un potente apoyo de inteligencia artificial a usuarios y empresas.