No lançamento do evento Volcano Engine AI Innovation Tour em Hangzhou, em 17 de abril, Tan Dai, presidente da Volcano Engine, subsidiária da ByteDance, anunciou oficialmente o mais recente modelo de raciocínio profundo Doubao 1.5. O lançamento atraiu a atenção de muitos profissionais do setor, e Tan Dai compartilhou no evento o desempenho excepcional do modelo em várias áreas.
Segundo informações, o modelo Doubao 1.5 demonstrou capacidades excepcionais em áreas profissionais como matemática, programação e raciocínio científico, além de tarefas de escrita criativa. Este novo modelo utiliza a arquitetura MoE (Mixture of Experts), com um total de 20 bilhões de parâmetros, enquanto os parâmetros ativados são apenas 2 bilhões, significativamente menor que a escala de parâmetros de modelos semelhantes do setor, resultando em uma clara vantagem em termos de custo de inferência.
Tan Dai também apresentou detalhadamente os poderosos recursos do modelo de raciocínio profundo Doubao 1.5, incluindo várias aplicações com tecnologia de compreensão visual. Esses recursos não apenas podem analisar a paisagem a partir de fotos, mas também podem ajudar os usuários a pedir comida durante viagens e até mesmo auxiliar empresas a concluir fluxogramas de gestão de projetos.
Além disso, a Volcano Engine também lançou a versão 3.0 do modelo Doubao de geração de imagens a partir de texto. Esta atualização trouxe uma formatação de texto mais agradável, capacidade de geração de imagens mais refinada e capacidade de saída direta de imagens em 2K. Os usuários podem desfrutar de uma experiência visual mais rica.
Ainda mais notável é a melhoria na capacidade de busca de vídeos do novo modelo. Ao realizar uma busca, o modelo pode encontrar rapidamente as respostas relevantes dentro do vídeo. Este recurso melhora significativamente a conveniência do usuário em obter informações.
De acordo com Tan Dai, o uso do modelo Doubao está crescendo a um ritmo surpreendente. Em março de 2025, o uso diário de tokens do modelo Doubao ultrapassou 12,7 trilhões, um aumento de mais de 106 vezes em comparação com o lançamento inicial. Este dado reflete plenamente a popularidade do modelo Doubao no mercado.
Destaques:
📈 O modelo Doubao 1.5 apresenta um desempenho excepcional em diversas áreas profissionais e em escrita criativa, utilizando a arquitetura MoE avançada e uma configuração de parâmetros otimizada.
🌍 O novo modelo, combinado com tecnologia de compreensão visual, pode analisar fotos, auxiliar em viagens e na gestão de projetos, oferecendo recursos poderosos.
🎥 A capacidade de busca em vídeo foi significativamente aprimorada, permitindo que os usuários acessem rapidamente informações relevantes em vídeos, com um uso contínuo em crescimento.