Lanzamiento del gran modelo de lenguaje de código abierto DeepSeek R1, supera el rendimiento del modelo o1 y reduce el costo en un 90%

Cuerpo del texto: Recientemente, el equipo chino DeepSeek lanzó su nuevo modelo de lenguaje grande de código abierto R1, que ha generado un gran interés. El rendimiento del modelo R1 es excepcional, superando al modelo o1 de OpenAI en varias pruebas, especialmente en matemáticas y programación.

En la última prueba AIME2024 en Estados Unidos, R1 obtuvo una puntuación de 79.8, superando los 79.2 puntos de o1. En la prueba MATH-500, R1 obtuvo 97.3 puntos, superando también los 96.4 puntos de o1. Además, en la prueba SWE-bench Verified, R1 obtuvo una puntuación de 49.2, superando los 48.9 puntos de o1. Aunque en la prueba de código Codeforces, R1 solo obtuvo 0.3 puntos menos que o1, su rendimiento general es comparable al del modelo o1.

Además del rendimiento, la ventaja de costos de R1 es aún más notable. El modelo o1 de OpenAI cuesta hasta 15 dólares por cada millón de tokens de entrada, mientras que R1 solo cuesta 0.14 dólares, lo que representa una reducción de costos del 90%. En cuanto a la salida, o1 cuesta 60 dólares por cada millón de tokens, mientras que R1 solo cuesta 2.19 dólares, una reducción de 27 veces. Esta enorme diferencia de costos hace que R1 destaque en el campo de los modelos de lenguaje grandes de código abierto.

Tras el anuncio del lanzamiento de código abierto de R1 por parte del equipo DeepSeek, muchos usuarios internacionales expresaron su admiración por este modelo, considerando que R1 supera a plataformas de código abierto establecidas como Meta y Mistral en términos de rendimiento y relación calidad-precio. Muchos afirman que la eficiente capacidad de inferencia del modelo R1 lo hace destacar en la escritura de código y la explicación matemática, e incluso hay usuarios que lo califican como "el modelo más parecido al monólogo interior humano". Además, Awni Hannun, investigador de aprendizaje automático de Apple, probó R1 y descubrió que funciona rápidamente y con alta eficiencia de inferencia en Apple M2 Ultra.

El desarrollo del modelo R1 ha pasado por varias etapas de entrenamiento, incluyendo datos de arranque en frío y entrenamiento multietapa, para mejorar su capacidad de inferencia y legibilidad. Estas mejoras técnicas garantizan el excelente rendimiento del modelo R1 en diversas tareas.

Con el lanzamiento de R1, los modelos de lenguaje grandes de código abierto de China han vuelto a llamar la atención y a generar debate en el mercado internacional, y muchos entusiastas de la tecnología esperan el potencial de este modelo. El lanzamiento de R1 marca un nuevo avance en el campo de la tecnología de modelos de lenguaje grandes en China, impulsando el desarrollo de la tecnología de código abierto.

Dirección de código abierto: https://huggingface.co/deepseek-ai/R1

API: https://api-docs.deepseek.com/guides/reasoning_model

Puntos clave:
🌟 El modelo R1 supera al o1 de OpenAI en varias pruebas, mostrando un rendimiento excepcional.
💰 El costo de entrada y salida de R1 es de tan solo 0.14 dólares y 2.19 dólares respectivamente, con una reducción de costos del 90%.
🚀 Tras su lanzamiento de código abierto, R1 ha recibido una gran atención, y muchos expertos internacionales han elogiado su rendimiento y su excelente relación calidad-precio.

Noticias de IA

Lanzamiento del gran modelo de lenguaje de código abierto DeepSeek R1, supera el rendimiento del modelo o1 y reduce el costo en un 90%

AIbase基地

Noticias de IA relacionadas recomendadas

¡Sin entrenamiento! Q-Filters permite una compresión eficiente de la caché KV y mejora el rendimiento de la inferencia

El servicio de recarga de la API de la plataforma abierta DeepSeek se ha restablecido oficialmente

Lei Jun: La primera computadora portátil para oficina profesional con IA de Xiaomi se lanzará esta semana

Descifrando el Lado Oscuro de la Luna o1: Long-CoT es la clave, el pensamiento del modelo necesita "pensar a largo plazo"