Modelo de lenguaje grande de código abierto de 70B supera a ChatGPT en matemáticas: ajuste fino de IA con IA, desarrollado por un equipo completamente chino de Microsoft

微信公众平台

Publicado elNoticias de IA · 2 minutos de lectura · Aug 14, 2023

El Modelo WizardMath

El modelo WizardMath, desarrollado completamente por un equipo chino en Microsoft, es un modelo de código abierto de 70B parámetros. Utilizando instrucciones generadas por IA para un ajuste fino del modelo, ha superado en capacidad matemática a otros modelos grandes como ChatGPT, Claude Instant 1 y PaLM 2-540B.

El código fuente y el artículo del modelo WizardMath ya están disponibles en GitHub, atrayendo una amplia atención de la comunidad académica y de desarrolladores. El método empleado utiliza la técnica "Evil Instruction", generando automáticamente instrucciones de dominio abierto con diversos niveles de dificultad para mejorar el rendimiento del modelo.

Los autores también han desarrollado modelos para otros campos utilizando este método, como WizardCoder, enfocado en la capacidad de codificación.

El equipo de investigación está compuesto por varios científicos chinos, incluyendo investigadores del Instituto de Ingeniería de Internet de Microsoft Asia y Microsoft Research.

CITIC Steel integra con éxito el modelo grande DeepSeek-R1 para impulsar la transformación digital

CITIC Steel ha dado un paso importante en su transformación digital. Recientemente, anunció en una plataforma de interacción que ha integrado con éxito el modelo grande DeepSeek-R1. La empresa declaró que en el futuro se dedicará a promover la profunda integración de la tecnología digital con la economía real, sobre la base de lo cual llevará a cabo reformas integrales, con el objetivo de acelerar la construcción de activos de datos y explorar el valor potencial de los datos. Los esfuerzos de CITIC Steel para promover el mantenimiento inteligente son una medida estratégica para la empresa en la feroz competencia del mercado. Gracias a la integración del modelo grande DeepSeek-R1, el "mensajero de acero especial" de la empresa...

vivo lanza una nueva versión de "Blue Heart Little V" con capacidades de modelo grande DeepSeek, iniciando el pensamiento profundo inteligente

Recientemente, vivo anunció una actualización gris de la versión 5.2.1.22 de su asistente de voz "Blue Heart Little V", una actualización muy esperada por los usuarios que agrega soporte para las capacidades del modelo grande DeepSeek. Esta incorporación permitirá a "Little V" ofrecer capacidades de pensamiento profundo más inteligentes, ayudando a los usuarios a procesar mejor la información. Según los comentarios de los usuarios, al activar la función de pensamiento profundo (R1), "Blue Heart Little V" puede realizar un pensamiento más completo y profundo según las instrucciones del usuario.

El asistente de voz Xiao AI de Xiaomi se integra de nuevo con el modelo grande DeepSeek R1

Los usuarios ahora pueden activar DeepSeek-R1 diciendo "Activar Pensamiento Profundo" a Xiao AI para disfrutar de sus funciones de escritura de código, redacción de artículos y razonamiento lógico. Aunque Xiaomi aún no lo ha anunciado oficialmente, la cobertura de Xiao AI ya incluye más de 25 modelos de Xiaomi y Redmi.

SuperMap completa con éxito la adaptación del modelo grande DeepSeek-V3/R1; SuperMap Copilot versión Beta ya disponible

SuperMap ha anunciado recientemente en su plataforma interactiva que ha completado con éxito la integración y adaptación de los modelos grandes DeepSeek-V3 y de la serie R1. Este avance marca otro gran paso en la aplicación de tecnología inteligente de SuperMap. Como resultado de esta innovación, la versión Beta de SuperMap Copilot también se ha lanzado oficialmente y está disponible para los clientes. Este producto no solo muestra las potentes funciones de los modelos grandes, sino que también presenta ventajas significativas en términos de ser "más, rápido, mejor y económico", demostrando el compromiso de SuperMap con la promoción de productos inteligentes.