A ByteDance lançou oficialmente seu mais recente modelo de linguagem grande, o Doubao-1.5-pro. Este novo modelo demonstrou excelente desempenho em várias áreas, superando modelos de renome na indústria, como o GPT-4o e o Claude3.5Sonnet. O lançamento deste modelo marca mais um passo importante da ByteDance no campo da inteligência artificial.
O Doubao-1.5-Pro utiliza uma nova arquitetura MoE (Mixture of Experts) esparsa, com pré-treinamento usando um menor número de parâmetros de ativação. A inovação deste design reside na capacidade de fornecer desempenho equivalente a um modelo Dense com 7 vezes mais parâmetros de ativação, tornando-o significativamente mais eficiente que as arquiteturas MoE convencionais da indústria, com uma melhoria de aproximadamente 3 vezes na eficiência. Este design permite que o modelo Doubao obtenha pontuações ainda melhores em vários benchmarks, incluindo conhecimento, código, raciocínio e chinês.
Além da atualização do modelo principal, a ByteDance também lançou o modelo de compreensão visual Doubao-1.5-vision-pro e o modelo de voz em tempo real Doubao-1.5-realtime-voice-pro. O novo modelo de compreensão visual passou por atualizações tecnológicas abrangentes em processamento de dados multimodais, resolução dinâmica e compreensão de informações granulares, melhorando ainda mais suas capacidades em raciocínio visual e compreensão de texto. Simultaneamente, o lançamento do modelo de voz em tempo real permite que o aplicativo Doubao ofereça uma experiência de conversação de voz mais fluida, com baixa latência e capacidade de interrupção a qualquer momento durante a conversa.
A ByteDance declarou oficialmente que o modelo Doubao não utilizou dados gerados por modelos externos durante o treinamento, garantindo a independência e confiabilidade do modelo. Além disso, o preço de todos os novos produtos permanecerá inalterado, e os usuários podem experimentar os novos recursos diretamente no aplicativo Doubao.
Este lançamento não apenas demonstra a capacidade contínua de inovação da ByteDance na área de IA, mas também fornece aos desenvolvedores um poderoso suporte de API, impulsionando ainda mais a popularização e aplicação da tecnologia de inteligência artificial.