SenseTime ha lanzado oficialmente su modelo de lenguaje grande fusionado "Ríndete a lo nuevo" (日日新). Este modelo ha logrado mejoras significativas en el procesamiento de información multimodal y la capacidad de razonamiento profundo, obteniendo el primer lugar en dos prestigiosas listas de evaluación.
Según el informe de evaluación de referencia de modelos de lenguaje grandes en chino 2024 publicado por la autoridad nacional SuperCLUE, el modelo fusionado "Ríndete a lo nuevo" de SenseTime obtuvo una alta puntuación de 68.3, empatando en el primer lugar a nivel nacional con DeepSeek V3. Además, en la evaluación multimodal de OpenCompass, este modelo también ocupó el primer lugar, superando significativamente a GPT-4o.
El modelo fusionado "Ríndete a lo nuevo" de SenseTime marca un avance sustancial en el entrenamiento de modelos de fusión nativa multimodal. Esto significa que el modelo puede fusionar información de varios tipos, como texto, imágenes y videos, abriendo nuevas posibilidades para la industria. En la evaluación de SuperCLUE, el modelo obtuvo excelentes resultados tanto en humanidades como en ciencias, ocupando el primer lugar mundial en humanidades con 81.8 puntos y obteniendo una medalla de oro en ciencias, con una puntuación de 78.2 en el componente de cálculo, el mejor a nivel nacional.
La característica principal del modelo fusionado "Ríndete a lo nuevo" es su capacidad para procesar simultáneamente información compleja y diversa. No solo puede reconocer texto ambiguo, sino que también puede analizar rápidamente gráficos de datos y proporcionar un razonamiento profundo. En aplicaciones prácticas, este modelo ha demostrado ventajas únicas, especialmente en áreas como la conducción autónoma, la interacción por video, la educación y la oficina, las finanzas y la fabricación industrial.
Durante el desarrollo del producto, SenseTime utilizó una gran cantidad de datos que combinan texto e imágenes. Mediante técnicas de síntesis avanzadas, se estableció un puente de interacción entre las modalidades, mejorando la capacidad del modelo para comprender la información multimodal. Además, SenseTime construyó una amplia gama de tareas multimodales, proporcionando una base sólida para el entrenamiento del modelo fusionado "Ríndete a lo nuevo". Gracias a este método de entrenamiento innovador, el modelo multimodal fusionado de SenseTime puede responder eficazmente a las necesidades de los usuarios en diversas situaciones, logrando un ciclo virtuoso entre la implementación de aplicaciones y la iteración del modelo básico.
Puntos clave:
🌟 SenseTime lanza el modelo de lenguaje grande fusionado "Ríndete a lo nuevo", con un rendimiento excepcional.
📊 El modelo destaca en humanidades y ciencias, ocupando el primer lugar mundial en humanidades y el primero a nivel nacional en ciencias.
🚀 El modelo es aplicable a múltiples campos, como la conducción autónoma, las finanzas y la educación online, demostrando una potente capacidad de procesamiento multimodal.