El éxito de DeepSeek V3 demuestra el rápido desarrollo de la IA en China

AIbase基地

Publicado elNoticias de IA · 3 minutos de lectura · Jan 17, 2025

273

Recientemente, la empresa de IA DeepSeek, ubicada en Hangzhou, lanzó su último modelo de lenguaje grande: V3. Este modelo de código abierto ha demostrado un rendimiento cercano al de los modelos 4o de OpenAI y Claude 3.5 Sonnet de Anthropic en varias pruebas de referencia, lo que ha llamado la atención de la industria. En comparación con la inversión de cientos de millones de dólares de sus homólogos estadounidenses, el costo total del modelo V3 de DeepSeek fue de solo 5,6 millones de dólares, una diferencia notable.

Modelo grande Metaverso (1)

Nota de la fuente: La imagen fue generada por IA, con licencia de Midjourney.

Liang Wenfeng, CEO de DeepSeek, afirmó que la financiación nunca ha sido un problema para ellos. A pesar de que V3 se entrenó con chips H800, el equipo de DeepSeek ha demostrado una sólida capacidad de investigación e ingeniería con recursos limitados.

El pionero en el campo de la IA, Andrej Karpathy, comentó al respecto que el presupuesto de inversión de DeepSeek es "una broma", pero que los resultados obtenidos son "una investigación e ingeniería impresionantes con restricciones de recursos".

La AGI se considera el "santo grial" de la investigación en IA, capaz de superar a los humanos en la resolución de problemas y la ejecución de tareas. Los expertos predicen que, una vez que la tecnología madure, el primer país en lograr la AGI tendrá una enorme ventaja económica, científica y de seguridad.

Dinámica del sector de grandes modelos de IA: el continuo avance de la tecnología y la colaboración

En el contexto del rápido desarrollo de la inteligencia artificial, la investigación y aplicación de grandes modelos de IA se encuentran en pleno auge. Recientemente, las últimas novedades de varias empresas e instituciones en este campo han generado un amplio interés. En primer lugar, el ratio precio-beneficio de Nvidia antes del lanzamiento de ChatGPT atrajo gran atención en Wall Street, y los expertos consideran que este fenómeno podría presagiar una repetición del éxito de Apple en 2008. Simultáneamente, Yu Feng, director de información de Guotai Junan, afirmó que el auge de los grandes modelos de IA impulsará al sector de valores hacia una era de "cognición inteligente".

Realme UI 6.0 integra oficialmente el asistente Xiaobu con la versión completa de DeepSeek-R1

Recientemente, Kang Da Leo, gerente de producto de Realme UI, anunció una importante actualización: el asistente Xiaobu del sistema Realme UI 6.0 ya está oficialmente integrado con la versión completa de DeepSeek-R1. Esta actualización abarca seis modelos de Realme: GT7 Pro, GT7 Pro Edición Velocidad, Neo7, Neo7 SE, GT5 Pro y GT6, ofreciendo a numerosos usuarios de teléfonos Realme una experiencia de uso más inteligente y eficiente.

Noticias de IA

El éxito de DeepSeek V3 demuestra el rápido desarrollo de la IA en China

AIbase基地

Noticias de IA relacionadas recomendadas

Dinámica del sector de grandes modelos de IA: el continuo avance de la tecnología y la colaboración

Nueva herramienta de IA promete predecir la degeneración cerebral, revolucionando potencialmente el tratamiento del Alzheimer

Centro de cómputo de Guangzhou accede al modelo de lenguaje grande Tongyi Qianwen QwQ-32B de Alibaba

Realme UI 6.0 integra oficialmente el asistente Xiaobu con la versión completa de DeepSeek-R1