SenseTime lanza el modelo de lenguaje grande "Ríndete a diario", comparable a DeepSeek V3

AIbase基地

Publicado elNoticias de IA · 5 minutos de lectura · Jan 10, 2025

584

SenseTime ha lanzado oficialmente su modelo de lenguaje grande fusionado "Ríndete a lo nuevo" (日日新). Este modelo ha logrado mejoras significativas en el procesamiento de información multimodal y la capacidad de razonamiento profundo, obteniendo el primer lugar en dos prestigiosas listas de evaluación.

Según el informe de evaluación de referencia de modelos de lenguaje grandes en chino 2024 publicado por la autoridad nacional SuperCLUE, el modelo fusionado "Ríndete a lo nuevo" de SenseTime obtuvo una alta puntuación de 68.3, empatando en el primer lugar a nivel nacional con DeepSeek V3. Además, en la evaluación multimodal de OpenCompass, este modelo también ocupó el primer lugar, superando significativamente a GPT-4o.

El modelo fusionado "Ríndete a lo nuevo" de SenseTime marca un avance sustancial en el entrenamiento de modelos de fusión nativa multimodal. Esto significa que el modelo puede fusionar información de varios tipos, como texto, imágenes y videos, abriendo nuevas posibilidades para la industria. En la evaluación de SuperCLUE, el modelo obtuvo excelentes resultados tanto en humanidades como en ciencias, ocupando el primer lugar mundial en humanidades con 81.8 puntos y obteniendo una medalla de oro en ciencias, con una puntuación de 78.2 en el componente de cálculo, el mejor a nivel nacional.

La característica principal del modelo fusionado "Ríndete a lo nuevo" es su capacidad para procesar simultáneamente información compleja y diversa. No solo puede reconocer texto ambiguo, sino que también puede analizar rápidamente gráficos de datos y proporcionar un razonamiento profundo. En aplicaciones prácticas, este modelo ha demostrado ventajas únicas, especialmente en áreas como la conducción autónoma, la interacción por video, la educación y la oficina, las finanzas y la fabricación industrial.

Durante el desarrollo del producto, SenseTime utilizó una gran cantidad de datos que combinan texto e imágenes. Mediante técnicas de síntesis avanzadas, se estableció un puente de interacción entre las modalidades, mejorando la capacidad del modelo para comprender la información multimodal. Además, SenseTime construyó una amplia gama de tareas multimodales, proporcionando una base sólida para el entrenamiento del modelo fusionado "Ríndete a lo nuevo". Gracias a este método de entrenamiento innovador, el modelo multimodal fusionado de SenseTime puede responder eficazmente a las necesidades de los usuarios en diversas situaciones, logrando un ciclo virtuoso entre la implementación de aplicaciones y la iteración del modelo básico.

Puntos clave:
🌟 SenseTime lanza el modelo de lenguaje grande fusionado "Ríndete a lo nuevo", con un rendimiento excepcional.
📊 El modelo destaca en humanidades y ciencias, ocupando el primer lugar mundial en humanidades y el primero a nivel nacional en ciencias.
🚀 El modelo es aplicable a múltiples campos, como la conducción autónoma, las finanzas y la educación online, demostrando una potente capacidad de procesamiento multimodal.

¡El auge de los modelos de razonamiento profundo! Together AI recauda 305 millones de dólares para impulsar la demanda de GPU

En la industria de la IA, Together AI anunció recientemente una ronda de financiación Serie B de 305 millones de dólares, una noticia que ha generado un gran interés. El auge de la compañía está estrechamente relacionado con su recién lanzado modelo de razonamiento profundo, DeepSeek-R1. Contrariamente a las preocupaciones iniciales, muchos expertos de la industria creen que los avances en el razonamiento profundo no han disminuido la demanda de infraestructura, sino que la han aumentado constantemente. Nota de la imagen: Imagen generada por IA, Midjourney, proveedor de servicios de licencias de imágenes, desde su creación en 2023.

xAI de Musk lanza oficialmente el modelo de razonamiento profundo Grok 3, que incorpora cadenas de pensamiento y se integrará en los cohetes SpaceX en los próximos dos años

Hoy, xAI, liderada por Elon Musk, lanzó oficialmente su último modelo, Grok3, que Musk calificó como la "IA más inteligente del planeta". Competirá con ChatGPT, Gemini, DeepSeek y Claude, entre otros. En el lanzamiento, xAI mostró varias pruebas de referencia en las que Grok3 superó a Gemini2Pro, Claude3.5Sonnet, GPT4o y Dee en pruebas de referencia de matemáticas, ciencias y codificación.

Anthropic lanzará pronto un modelo de IA híbrido: velocidad y razonamiento profundo, con un coste controlado

Según The Information, la startup de inteligencia artificial Anthropic planea lanzar en las próximas semanas un nuevo modelo de IA híbrido. Este modelo tiene la capacidad de cambiar flexiblemente entre el modo de respuesta rápida y el modo de razonamiento profundo, ofreciendo a los desarrolladores un control y una flexibilidad sin precedentes. El mayor atractivo de este modelo radica en su coste computacional ajustable. A diferencia de los modelos de OpenAI con una configuración fija, el modelo de Anthropic utiliza una escala deslizante basada en tokens, permitiendo a los desarrolladores una precisión en...

iFlytek lanza el modelo de razonamiento profundo Xinghuo X1

Hoy, iFlytek ha lanzado oficialmente su primer modelo de razonamiento profundo basado en una plataforma de computación nacional: el modelo de razonamiento profundo Xinghuo X1. Este innovador logro marca otro avance importante para iFlytek en el campo de la inteligencia artificial. El modelo de razonamiento profundo Xinghuo X1 muestra características similares al pensamiento lento humano en el proceso de resolución de problemas, y logra un rendimiento líder en la industria con una potencia de cálculo relativamente baja, ocupando el primer lugar en el país en varios indicadores clave. En particular, el modelo muestra un excelente rendimiento en la capacidad matemática en chino, demostrando una poderosa tecnología.