Tülu 3 405B
Tülu 3 405B é um modelo de linguagem de código aberto em larga escala, com desempenho aprimorado por meio de aprendizado por reforço.
Novo Produto PremiumProgramaçãoInteligência ArtificialProcessamento de Linguagem Natural
Tülu 3 405B é um modelo de linguagem de código aberto desenvolvido pelo Allen Institute for AI, com 405 bilhões de parâmetros. O modelo utiliza uma estrutura inovadora de aprendizado por reforço (RLVR) para aprimorar seu desempenho, especialmente em tarefas matemáticas e de seguimento de instruções. Ele é baseado no modelo Llama-405B e otimizado por meio de ajuste fino supervisionado e otimização de preferência direta. A natureza de código aberto do Tülu 3 405B o torna uma ferramenta poderosa para pesquisa e desenvolvimento, adequada a diversos cenários de aplicação que exigem modelos de linguagem de alto desempenho.
Tülu 3 405B Situação do Tráfego Mais Recente
Total de Visitas Mensais
575652
Taxa de Rejeição
51.62%
Média de Páginas por Visita
2.3
Duração Média da Visita
00:01:43