Recientemente, la empresa de IA DeepSeek, ubicada en Hangzhou, lanzó su último modelo de lenguaje grande: V3. Este modelo de código abierto ha demostrado un rendimiento cercano al de los modelos 4o de OpenAI y Claude 3.5 Sonnet de Anthropic en varias pruebas de referencia, lo que ha llamado la atención de la industria. En comparación con la inversión de cientos de millones de dólares de sus homólogos estadounidenses, el costo total del modelo V3 de DeepSeek fue de solo 5,6 millones de dólares, una diferencia notable.
Nota de la fuente: La imagen fue generada por IA, con licencia de Midjourney.
Liang Wenfeng, CEO de DeepSeek, afirmó que la financiación nunca ha sido un problema para ellos. A pesar de que V3 se entrenó con chips H800, el equipo de DeepSeek ha demostrado una sólida capacidad de investigación e ingeniería con recursos limitados.
El pionero en el campo de la IA, Andrej Karpathy, comentó al respecto que el presupuesto de inversión de DeepSeek es "una broma", pero que los resultados obtenidos son "una investigación e ingeniería impresionantes con restricciones de recursos".
La AGI se considera el "santo grial" de la investigación en IA, capaz de superar a los humanos en la resolución de problemas y la ejecución de tareas. Los expertos predicen que, una vez que la tecnología madure, el primer país en lograr la AGI tendrá una enorme ventaja económica, científica y de seguridad.