Recientemente, el campo de la inteligencia artificial ha experimentado un gran avance. Deepseek, una empresa de IA, ha lanzado el modelo Coder v2, el cual ha demostrado un rendimiento excepcional en múltiples pruebas, superando al modelo Gemini de Google y convirtiéndose en el nuevo líder en el campo de la inteligencia artificial de código abierto. Según Livebench AI (una plataforma de evaluación comparativa reconocida por su dificultad de manipulación), el modelo Deepseek Coder v2 se ubica solo detrás de los modelos comerciales de OpenAI y Anthropic, ocupando el tercer lugar entre los modelos de código abierto. Este logro marca un rápido avance de la tecnología de inteligencia artificial de código abierto en la persecución de los gigantes comerciales.
Deepseek Coder v2 destaca particularmente en programación y razonamiento. Cabe destacar que su rendimiento en matemáticas incluso supera a todas las variantes de GPT-4. Aunque sus habilidades lingüísticas son ligeramente inferiores, su excelente desempeño en otras áreas compensa esta deficiencia.
Mientras tanto, el nuevo modelo de lenguaje grande (LLM) Gemini de Google, aunque se desempeña bien en las clasificaciones de evaluación humana, se considera que no es un modelo verdaderamente excelente. En comparación, Deepseek Coder v2 muestra un rendimiento superior en casos de uso de producción real.
Expertos de la industria predicen que si OpenAI y Anthropic se centran en funciones auxiliares en lugar de en la tecnología de IA central, es muy probable que los modelos de código abierto alcancen el primer lugar antes de fin de año. Esta tendencia indica que la inteligencia artificial de código abierto está reduciendo rápidamente la brecha con los gigantes comerciales, y su potencial de desarrollo futuro es enorme.
El auge de Deepseek Coder v2 no solo demuestra la capacidad de innovación de la comunidad de código abierto, sino que también inyecta nueva vitalidad en la democratización y diversificación del desarrollo de la inteligencia artificial. Con el continuo progreso de la tecnología, tenemos razones para esperar el surgimiento de más modelos de IA de código abierto innovadores que impulsen el avance de toda la industria.