¡Gran avance en modelos nacionales de IA! DeepSeek R1 se lanza como código abierto, con rendimiento comparable a OpenAI, abriendo una nueva era de igualdad en IA

AIbase基地

Publicado elNoticias de IA · 4 minutos de lectura · Jan 21, 2025

897

DeepSeek ha lanzado oficialmente y de código abierto su último modelo de lenguaje grande, R1, que muestra un rendimiento excepcional y se considera comparable a la versión oficial de o1 de OpenAI. Este hito no solo representa un gran avance en la tecnología de IA nacional, sino que también ofrece a los desarrolladores de IA de todo el mundo una nueva opción.

DeepSeek R1 ha aplicado ampliamente la técnica de aprendizaje por refuerzo en la etapa de post-entrenamiento, mejorando significativamente la capacidad de razonamiento del modelo incluso con datos etiquetados escasos. En tareas clave como matemáticas, código e inferencia de lenguaje natural, el rendimiento de DeepSeek R1 es comparable al de la versión oficial de OpenAI o1, demostrando su gran potencia.

Para retribuir a la comunidad de código abierto, DeepSeek también ha publicado de código abierto los modelos DeepSeek-R1 y DeepSeek-R1-Zero, ambos con 660B parámetros. Además, DeepSeek ha publicado de código abierto 6 modelos más pequeños a través de la técnica de destilación de modelos, incluyendo modelos con 32B y 70B parámetros. Estos modelos más pequeños superan a o1-mini de OpenAI en varias capacidades, enriqueciendo aún más el ecosistema de código abierto.

En cuanto a la fijación de precios de la API, DeepSeek también muestra una actitud abierta: el costo por cada millón de tokens de entrada con caché es de solo 1 yuan, mientras que sin caché es de 4 yuanes; el costo por cada millón de tokens de salida es de 16 yuanes, ofreciendo un precio general más competitivo.

Más importante aún, DeepSeek R1 utiliza la licencia MIT estándar, permitiendo su uso comercial sin restricciones. DeepSeek también anima a los usuarios a utilizar los resultados de R1 para entrenar otros modelos, impulsando aún más la popularización y el desarrollo de la tecnología de IA. La publicación de código abierto de DeepSeek R1 sin duda proporcionará a los desarrolladores de todo el mundo herramientas más potentes, inyectando nueva vitalidad en la innovación y aplicación de la tecnología de IA, y presagiando la aceleración de la era de la igualdad de acceso a la tecnología de IA.

Artículo: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

Documentación de la API: https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

DeepSeek R1 OpenAI Modelo de lenguaje grande

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

ZHUOYU Technology integra con éxito el modelo de lenguaje grande Tongyi de Alibaba, impulsando el desarrollo de la tecnología de conducción inteligente

En el reciente Salón del Automóvil de Shanghai, ZHUOYU Technology (abreviado como "ZHUOYU") anunció que ha integrado con éxito el modelo de lenguaje grande Tongyi de Alibaba, un hito importante en su avance en el campo de la conducción inteligente. Como proveedor y prestador de servicios de conducción inteligente, ZHUOYU, con la ayuda de la potente capacidad de computación de Alibaba Cloud, se dedica a construir un modelo mundial de conducción inteligente de extremo a extremo para mejorar el nivel de inteligencia de los automóviles. En los últimos años, la tecnología de conducción inteligente ha experimentado un rápido desarrollo, y los principales fabricantes de automóviles han aumentado considerablemente su inversión en este campo. En su colaboración con el modelo de lenguaje grande Tongyi de Alibaba, ZHUOYU Technology ya...

Apr 24, 2025

Orange Lion Sports Smartshot se integra con el modelo de lenguaje grande Tongyi, abriendo una nueva era de inteligencia deportiva

En la era del rápido desarrollo tecnológico, la inteligencia artificial (IA) se ha convertido en una herramienta importante para mejorar la eficiencia e impulsar la innovación en todos los sectores. Recientemente, Orange Lion Sports anunció oficialmente que su asistente de imágenes deportivas con IA, "Orange Lion Huying Smartshot", se ha integrado con el último modelo de inferencia de código abierto de Tongyi Qianwen, QwQ-32B. Esta iniciativa marca una importante actualización tecnológica para Smartshot en el análisis del rendimiento de los atletas y el registro de datos. Smartshot se basa inicialmente en la visión por computadora y las técnicas de aprendizaje automático,

Apr 15, 2025

智谱发布新一代开源 GLM 模型，320亿参数媲美 DeepSeek R1，速度提升 8 倍

智谱 AI 发布了新一代开源大型语言模型 GLM，拥有 320 亿参数，性能媲美 DeepSeek R1，但速度提升了 8 倍。这是一个具有里程碑意义的突破，将加速 AI 技术的普及和应用。

Apr 15, 2025

El modelo de lenguaje grande Zhiyu de Yiren Technology completa su registro: un paso clave hacia el cumplimiento, la IA impulsa el futuro de las finanzas

Recientemente, Yiren Technology (código bursátil en EE. UU.: YRD) anunció que su modelo de lenguaje grande Zhiyu, desarrollado internamente, ha completado oficialmente su registro de acuerdo con las disposiciones pertinentes del "Método provisional para la gestión de los servicios de inteligencia artificial generativa". Esta noticia marca un paso importante para Yiren Technology en el camino hacia la conformidad tecnológica de la IA, y también sienta una base sólida para sus aplicaciones inteligentes en el sector financiero. Como proveedor líder de servicios financieros impulsados por IA en China, Yiren Technology está impulsando la transformación del sector mediante la innovación tecnológica. Nota sobre la imagen: La imagen fue generada por IA, y el servicio de autorización de imágenes es Midjourney.

Apr 10, 2025

Curso práctico sobre el modelo de lenguaje grande Tencent HunYuan ya disponible en la plataforma nacional de educación inteligente

Mar 31, 2025

¡IFLYTEK Medical lanza el primer modelo de lenguaje grande del mundo para la diabetes tipo 1! ¡Se dice que supera a GPT-4!

IFLYTEK Medical ha anunciado hoy una importante noticia: el lanzamiento del primer modelo de lenguaje grande del mundo para la diabetes tipo 1, derivado de los resultados clave del importante proyecto nacional de las cuatro principales enfermedades crónicas. Se afirma que el lanzamiento de este modelo representa un importante avance científico que pasa del laboratorio a la aplicación clínica y que es la primera vez que la provincia de Anhui logra la transformación de los resultados de un importante proyecto nacional de investigación en el campo de la prevención y el control de enfermedades crónicas. Según la información proporcionada, este proyecto se centra en los puntos débiles clave del proceso de diagnóstico y tratamiento de la diabetes tipo 1, integrando datos multimodales con una amplia experiencia clínica, y se basa en la poderosa tecnología del modelo de lenguaje grande para atención médica IFLYTEK X1.

Mar 30, 2025

110

BMW anuncia colaboración con Alibaba en IA: el modelo de lenguaje grande Tongyi llegará a los vehículos

BMW Group y Alibaba Group anunciaron oficialmente una importante colaboración estratégica en el mercado chino. Ambas compañías se centrarán en el modelo de lenguaje grande de inteligencia artificial (IA) y en tecnologías de vanguardia como la interacción de voz inteligente, con el objetivo de desarrollar soluciones innovadoras que satisfagan mejor las necesidades de los usuarios chinos.

Mar 26, 2025

Fuentes afirman que BMW adoptará completamente el modelo de lenguaje grande Tongyi de Alibaba

Mar 26, 2025

LiblibAI integra el modelo de lenguaje grande Tongyi de Alibaba, lanzando una función de generación de video AI de 10 segundos

Mar 24, 2025

Wang Xing: Meituan ya ha desarrollado su propio modelo de lenguaje grande interno, LongCat, con una inversión de miles de millones de yuanes en recursos de GPU

El CEO de Meituan, Wang Xing, ha detallado la estrategia de la compañía en el campo de la inteligencia artificial (IA). Wang Xing reveló que durante el último año, Meituan ha priorizado asegurar el suministro de recursos de GPU, invirtiendo una gran suma de dinero en la construcción de infraestructura de IA. Además, indicó que Meituan planea aumentar aún más la inversión en infraestructura clave de IA en 2025 para fortalecer su presencia en este campo.

Mar 24, 2025

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General