Modelo de lenguaje grande DeepSeek LLM 67B de búsqueda profunda: de código abierto y de uso comercial gratuito

站长之家

Publicado elNoticias de IA · 2 minutos de lectura · Nov 30, 2023

163

DeepSeekLLM67B: Modelo de lenguaje grande de código abierto

DeepSeek ha lanzado un modelo de lenguaje grande de 67B parámetros llamado DeepSeekLLM67B. Este modelo es completamente de código abierto y se puede utilizar comercialmente de forma gratuita sin necesidad de solicitar permiso.

DeepSeekLLM67B muestra un buen rendimiento en razonamiento, matemáticas y programación, y ha demostrado una buena capacidad en pruebas de razonamiento de dominio abierto. DeepSeek también ha publicado modelos de 7B y 67B parámetros, junto con 9 checkpoints de entrenamiento intermedios disponibles para descargar.

Para obtener más información, visite la página principal de DeepSeek en Hugging Face.

CITIC Steel integra con éxito el modelo grande DeepSeek-R1 para impulsar la transformación digital

CITIC Steel ha dado un paso importante en su transformación digital. Recientemente, anunció en una plataforma de interacción que ha integrado con éxito el modelo grande DeepSeek-R1. La empresa declaró que en el futuro se dedicará a promover la profunda integración de la tecnología digital con la economía real, sobre la base de lo cual llevará a cabo reformas integrales, con el objetivo de acelerar la construcción de activos de datos y explorar el valor potencial de los datos. Los esfuerzos de CITIC Steel para promover el mantenimiento inteligente son una medida estratégica para la empresa en la feroz competencia del mercado. Gracias a la integración del modelo grande DeepSeek-R1, el "mensajero de acero especial" de la empresa...

El servicio de recarga de la API de la plataforma abierta DeepSeek se ha restablecido oficialmente

Con la restauración del servicio de recarga, DeepSeek también ha ajustado los precios de llamada de algunos modelos. El período de promoción del modelo deepseek-chat ha finalizado, y el precio de llamada del modelo V3 en el que se basa se ha ajustado a 2 yuanes por millón de tokens de entrada y 8 yuanes por millón de tokens de salida. El precio de llamada del modelo R1 en el que se basa el modelo deepseek-reasoner es de 4 yuanes por millón de tokens de entrada y 16 yuanes por millón de tokens de salida.

vivo lanza una nueva versión de "Blue Heart Little V" con capacidades de modelo grande DeepSeek, iniciando el pensamiento profundo inteligente

Recientemente, vivo anunció una actualización gris de la versión 5.2.1.22 de su asistente de voz "Blue Heart Little V", una actualización muy esperada por los usuarios que agrega soporte para las capacidades del modelo grande DeepSeek. Esta incorporación permitirá a "Little V" ofrecer capacidades de pensamiento profundo más inteligentes, ayudando a los usuarios a procesar mejor la información. Según los comentarios de los usuarios, al activar la función de pensamiento profundo (R1), "Blue Heart Little V" puede realizar un pensamiento más completo y profundo según las instrucciones del usuario.

La APP de Baidu se renueva completamente: lanzamiento de la entrada AI DeepseekR1 búsqueda profunda sin interrupciones

Hoy, la APP de Baidu anunció una actualización importante, lanzando oficialmente una nueva entrada AI en toda la plataforma, integrando profundamente el modelo Wencin con las capacidades del modelo DeepSeek, lo que ofrece a los usuarios una experiencia de uso completamente mejorada. Los aspectos más destacados de esta actualización incluyen la integración de varias funciones inteligentes de vanguardia, como "Búsqueda AI", "Extracción de información de toda la red", "Resumen AI con un toque" y "Agente digital inteligente", entre otros. La inclusión de estas funciones permite que la APP de Baidu comprenda de manera más precisa las necesidades del usuario y ofrezca una búsqueda más personalizada.