DeepScaleR-1.5B-Preview

Modelo de linguagem grande otimizado por aprendizado por reforço, focado na melhoria da capacidade de resolução de problemas matemáticos.

Produto ComumProdutividadeInteligência ArtificialAprendizado por Reforço

Abrir Site

DeepScaleR-1.5B-Preview é um modelo de linguagem grande otimizado por aprendizado por reforço, focado em melhorar a capacidade de resolução de problemas matemáticos. O modelo, através de algoritmos de aprendizado por reforço distribuído, melhora significativamente a precisão em cenários de raciocínio com textos longos. Suas principais vantagens incluem estratégias de treinamento eficientes, melhoria significativa de desempenho e flexibilidade de código aberto. O modelo foi desenvolvido pelo Sky Computing Lab e pela equipe Berkeley AI Research da Universidade da Califórnia, Berkeley, com o objetivo de impulsionar o uso da inteligência artificial na educação, especialmente em educação matemática e olimpíadas de matemática. O modelo utiliza a licença MIT de código aberto e é totalmente gratuito para pesquisadores e desenvolvedores.

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

DeepScaleR-1.5B-Preview

DeepScaleR-1.5B-Preview Situação do Tráfego Mais Recente

DeepScaleR-1.5B-Preview Tendência de Visitas

DeepScaleR-1.5B-Preview Distribuição Geográfica das Visitas

DeepScaleR-1.5B-Preview Fontes de Tráfego

DeepScaleR-1.5B-Preview Alternativas

DeepScaleR-1.5B-Preview — Modelo de linguagem grande otimizado por aprendizado por reforço, focado na melhoria da capacidade de resolução de problemas matemáticos.

Hun Yuan T1 — Modelo de raciocínio profundo líder do setor, otimizado para preferências humanas.

Light-R1 — Light-R1 é um projeto de código aberto focado em raciocínio de cadeia longa (Long COT), fornecendo um método de treinamento do zero por meio de SFT, DPO e RL.

NotaGen — NotaGen é um modelo para geração de música simbólica, que adota o paradigma de treinamento de modelos de linguagem grande e se concentra na geração de partituras clássicas de alta qualidade.

NovaSky — NovaSky é uma plataforma de tecnologia de inteligência artificial focada em geração de código e otimização de modelos de inferência.

Tülu 3 405B — Tülu 3 405B é um modelo de linguagem de código aberto em larga escala, com desempenho aprimorado por meio de aprendizado por reforço.

PaSa — PaSa é um agente de busca de artigos acadêmicos avançado, impulsionado por modelos de linguagem grandes, capaz de tomar decisões autônomas e obter resultados precisos.

DeepSeek-R1 — DeepSeek-R1 é um modelo de inferência de alto desempenho, que suporta múltiplas linguagens e tarefas, adequado para aplicações de pesquisa e comerciais.

RLLoggingBoard — Uma ferramenta para visualização do processo de treinamento de feedback humano de aprendizado por reforço, ajudando na compreensão e depuração profunda.

modelos-de-linguagem-grandes-autoadaptativos — Uma estrutura de modelo de linguagem grande que se adapta em tempo real a tarefas desconhecidas.

Meta Motivo — Primeira ferramenta de controle de agente físico virtual humanoide baseada em modelo de comportamento.

DeepMind — Empresa líder em pesquisa de inteligência artificial, subsidiária do Google.

DIAMOND — Agente de aprendizado por reforço treinado em um modelo de mundo de difusão.

OpenAI Universe — Plataforma de software para medir e treinar a inteligência geral artificial (AGI).

ReFT — ReFT: Aprimorando a capacidade de raciocínio de LLMs

Motif — Obtenha motivação intrínseca a partir do feedback de inteligência artificial.

OpenAI Codex CLI — Um agente de codificação leve que executa no terminal.

Liquid — Um modelo de geração multimodal que integra compreensão e geração visual.

HiDream — Plataforma de criação AIGC totalmente em português, fácil de usar, que ajuda a melhorar a criatividade.

GLM-4-32B — Modelo de linguagem poderoso, que suporta diversas tarefas de processamento de linguagem natural.

GenPRM — Expande o tempo de cálculo de teste do modelo de recompensa de processo por meio da inferência generativa.

Amazon Nova Sonic — O novo modelo básico da Amazon compreende tom, entonação e ritmo, melhorando a naturalidade da conversa entre humanos e máquinas.

DeepCoder — Um modelo de programação de código aberto com 14 bilhões de parâmetros, com capacidade de raciocínio de código eficiente.

Academia OpenAI — Ajuda os educadores a usar a inteligência artificial de forma eficaz por meio do conhecimento e das habilidades.

Agno — Uma biblioteca leve para construir agentes multimodais.

AccVideo — Modelo de difusão de vídeo acelerado, com aumento de velocidade de geração em 8,5 vezes.

Video-T1 — Melhora significativamente a qualidade da geração de vídeo através do dimensionamento do tempo de teste.

Gemini 2.5 — O Gemini 2.5 é o modelo de IA mais inteligente do Google, com capacidade de raciocínio.

Fin-R1 — Modelo de linguagem grande para raciocínio financeiro impulsionado por aprendizado por reforço.

Mixun T1 — El primer modelo de inferencia Mamba híbrido a gran escala de la industria, con una potente capacidad de inferencia.