A Reka AI, fundada por mais de uma dúzia de ex-cientistas do Google DeepMind, lançou recentemente seu primeiro modelo de código aberto: Reka Flash3. Este modelo de raciocínio, com 21 bilhões de parâmetros, chamou a atenção da indústria desde seu lançamento.
Apesar de ter apenas 21 bilhões de parâmetros, o Reka Flash3 é, segundo a empresa, um modelo de raciocínio geral treinado do zero. Ele não apenas passou por um ajuste fino supervisionado em conjuntos de dados sintéticos e públicos, mas também foi otimizado profundamente por meio de aprendizado por reforço baseado em modelo e regras (RLOO).
Essa abordagem “interna e externa” permitiu que o Reka Flash3 demonstrasse uma capacidade impressionante, superando até mesmo modelos com mais parâmetros, como o Command A e o Gemma327B.
Ainda mais emocionante é que o Reka Flash3 é considerado o melhor modelo de código aberto de tamanho semelhante. Isso significa que os desenvolvedores finalmente têm uma ferramenta poderosa e gratuita à sua disposição, permitindo-lhes explorar e construir aplicativos inovadores com mais liberdade.
As capacidades do Reka Flash3 vão além da simples geração de texto. Ele possui diversos recursos interessantes:
- Capacidade de raciocínio robusta: Como um modelo de raciocínio geral, o Reka Flash3 apresenta um desempenho notável em raciocínio lógico. Seja respondendo a perguntas complexas ou realizando raciocínios de vários passos, ele certamente mostrará seu lado “inteligente”.
- Baixa latência e amigável para implantação em dispositivos: A empresa destaca que o Reka Flash3 é um modelo de baixa latência e muito adequado para implantação em dispositivos. Isso significa que no futuro poderemos experimentar a conveniência deste poderoso modelo diretamente em nossos smartphones, tablets e outros dispositivos. Uma verdadeira bênção para a era da “eficiência acima de tudo”!
- Motor principal da plataforma Nexus: O Reka Flash3 não é apenas um modelo independente, mas também o motor principal da nova plataforma da Reka AI, o Nexus. A plataforma Nexus visa ajudar as organizações a criar e gerenciar trabalhadores de IA com capacidade de pesquisa profunda nativa, capazes de navegar na web, executar códigos e analisar arquivos internos, incluindo documentos, imagens, vídeos e áudios.
- Mecanismo de “pensamento” e controle de orçamento: O Reka Flash3 “pensa” antes de gerar uma saída e usa tags específicas para marcar o início e o fim do processo de pensamento. Curiosamente, a Reka AI também oferece um mecanismo de “força de orçamento”, permitindo que os usuários forcem a saída do modelo após um certo número de etapas de pensamento, mesmo que o pensamento não esteja concluído, mas geralmente ainda produz resultados razoáveis.
Embora o Reka Flash3 tenha capacidades excepcionais, a empresa admite que, como um modelo relativamente pequeno, não é a melhor opção para tarefas que exigem muito conhecimento. Para essas necessidades, a Reka AI recomenda o uso do Reka Flash3 em conjunto com ferramentas de busca na web, fornecendo ao modelo uma gama mais ampla de fontes de conhecimento.
Modelo: https://top.aibase.com/tool/reka-flash-3