DeepScaleR-1.5B-Preview

Un gran modelo lingüístico optimizado mediante aprendizaje por refuerzo, centrado en mejorar la capacidad de resolución de problemas matemáticos.

Producto ComúnProductividadInteligencia ArtificialAprendizaje por Refuerzo

Abrir sitio web

DeepScaleR-1.5B-Preview es un gran modelo lingüístico optimizado mediante aprendizaje por refuerzo, enfocado en mejorar la capacidad de resolución de problemas matemáticos. Este modelo, a través de algoritmos de aprendizaje por refuerzo distribuido, ha mejorado significativamente la precisión en escenarios de razonamiento con textos largos. Sus principales ventajas incluyen una estrategia de entrenamiento eficiente, una mejora de rendimiento notable y la flexibilidad de ser de código abierto. Desarrollado por el Sky Computing Lab y el equipo de Berkeley AI Research de la Universidad de California, Berkeley, tiene como objetivo impulsar la aplicación de la inteligencia artificial en el ámbito educativo, especialmente en la enseñanza de matemáticas y en las competiciones matemáticas. El modelo utiliza la licencia MIT de código abierto, siendo completamente gratuito para investigadores y desarrolladores.

Best AI Websites & Tools

DeepScaleR-1.5B-Preview

DeepScaleR-1.5B-Preview Situación del tráfico más reciente

DeepScaleR-1.5B-Preview Tendencia de visitas

DeepScaleR-1.5B-Preview Distribución geográfica de las visitas

DeepScaleR-1.5B-Preview Fuentes de tráfico

DeepScaleR-1.5B-Preview Alternativas

DeepScaleR-1.5B-Preview — Un gran modelo lingüístico optimizado mediante aprendizaje por refuerzo, centrado en mejorar la capacidad de resolución de problemas matemáticos.

NotaGen — NotaGen es un modelo para la generación de música simbólica, que adopta el paradigma de entrenamiento de modelos de lenguaje grande y se centra en la generación de partituras de música clásica de alta calidad.

HunyuanVideo-I2V — HunyuanVideo-I2V es un framework de generación de imagen a video basado en HunyuanVideo, desarrollado por Tencent.

Wan — Wan es un modelo de generación de video visualmente avanzado desarrollado por el laboratorio Tongyi de Alibaba, capaz de generar videos basados en texto, imágenes y otras señales.

NovaSky — NovaSky es una plataforma de tecnología de inteligencia artificial centrada en la generación de código y la optimización de modelos de inferencia.

SkyReels-V1-Hunyuan-I2V — SkyReels V1 es un modelo base de video centrado en el ser humano, de código abierto, enfocado en la generación de videos de alta calidad con apariencia cinematográfica.

SkyReels-V1 — SkyReels-V1 es el primer modelo base de video centrado en el ser humano de código abierto, enfocado en la generación de videos de alta calidad.

Lumina-Video — Lumina-Video es un proyecto inicial para la generación de video que admite la generación de video a partir de texto.

Tülu 3 405B — Tülu 3 405B es un modelo de lenguaje abierto de gran escala, cuyo rendimiento se ha mejorado mediante aprendizaje por refuerzo.

YuE — YuE es un modelo de base musical de código abierto centrado en la generación de canciones completas, capaz de crear obras musicales completas a partir de letras.

Llasa-1B — Llasa-1B es un modelo de texto a voz (TTS) basado en LLaMA, que admite la síntesis de voz en chino e inglés.

PaSa — PaSa es un agente de búsqueda de artículos académicos avanzado impulsado por modelos de lenguaje de gran tamaño (LLM), capaz de tomar decisiones autónomas y obtener resultados precisos.

DeepSeek-R1 — DeepSeek-R1 es un modelo de inferencia de alto rendimiento que admite múltiples idiomas y tareas, adecuado para aplicaciones de investigación y comerciales.

RLLoggingBoard — Una herramienta para visualizar el proceso de entrenamiento de retroalimentación humana de aprendizaje por refuerzo (RLHF), que ayuda a comprender y depurar en profundidad.

modelos-llm-autoadaptables — Un marco de modelos de lenguaje extenso (LLM) autoadaptable que se ajusta en tiempo real a tareas no vistas.

Meta Motivo — Primera herramienta de control de agente virtual físico humanoide basada en modelos de comportamiento.

Allegro-TI2V — Modelo de generación de vídeo a partir de texto e imagen

hertz-dev — Modelo base de generación de audio full-dúplex de código abierto

CogView3-Plus-3B — Modelo de generación de imágenes a partir de texto, compatible con la generación de imágenes de alta resolución.

Qwen2.5 — Modelo de lenguaje grande de código abierto, compatible con múltiples idiomas y aplicaciones de áreas profesionales.

DeepMind — Empresa líder en investigación de inteligencia artificial perteneciente a Google

g1 — Crea una cadena de razonamiento similar a o1 en Groq utilizando el modelo de código abierto Llama-3.1 70b

CogVideoX — Modelo de generación de video a partir de texto

DIAMOND — Agente de aprendizaje por refuerzo entrenado en un modelo de mundo de difusión.

360Zhinao-7B — Potente modelo de lenguaje conversacional inteligente basado en 7B parámetros

OpenAI Universe — Plataforma de software para medir y entrenar la inteligencia artificial general (AGI).

ReFT — ReFT: Mejora la capacidad de razonamiento de los LLMs

Motif — Obtener motivación intrínseca a partir de la retroalimentación de inteligencia artificial.

Wan.video — Wan_AI Creative Drawing es una plataforma que utiliza la tecnología de inteligencia artificial para la creación de dibujos y vídeos creativos.

Inception Labs — O Inception Labs lança uma nova geração de modelos de linguagem grandes difusivos, oferecendo capacidade de geração de linguagem ultrarrápida, eficiente e de alta qualidade.