DeepSeekLLM67B: Modelo de lenguaje grande de código abierto

DeepSeek ha lanzado un modelo de lenguaje grande de 67B parámetros llamado DeepSeekLLM67B. Este modelo es completamente de código abierto y se puede utilizar comercialmente de forma gratuita sin necesidad de solicitar permiso.

DeepSeekLLM67B muestra un buen rendimiento en razonamiento, matemáticas y programación, y ha demostrado una buena capacidad en pruebas de razonamiento de dominio abierto. DeepSeek también ha publicado modelos de 7B y 67B parámetros, junto con 9 checkpoints de entrenamiento intermedios disponibles para descargar.

Para obtener más información, visite la página principal de DeepSeek en Hugging Face.