Jais
Modelo de linguagem grande de 13 bilhões de parâmetros, isomórfico para árabe e inglês
Produto ComumProdutividadeChatbotChat inteligente
Este é um modelo de linguagem grande pré-treinado e bilíngue com 13 bilhões de parâmetros, que suporta árabe e inglês. Foi treinado em um conjunto de dados de 72 bilhões de tokens em árabe e 279 bilhões de tokens em inglês/código. Os dados em árabe foram iterados por 1,6 épocas (em comparação com 1 época para inglês/código), totalizando 395 bilhões de tokens de treinamento. O modelo é baseado na arquitetura Transformer decoder-only (GPT-3), usando a função de ativação não linear SwiGLU. Ele implementa a incorporação posicional ALiBi, que pode extrapolar para comprimentos de sequência longos, proporcionando melhor processamento de contexto e precisão do modelo.
Jais Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44