Modelo Matemático Qwen2 Math Demo do Tongyi Qianwen Lançado, Versão 72B Supera o GPT-4

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Aug 20, 2024

545

A equipe do "Tongyi Qianwen" da Alibaba fez um grande anúncio! Eles acabaram de lançar a demonstração do Qwen2Math, um modelo matemático que é simplesmente um monstro, superando até mesmo o GPT-4.

Este modelo não apenas resolve problemas matemáticos inseridos em texto, mas também entende fórmulas em imagens e capturas de tela. Imagine: você tira uma foto de uma equação e ele a resolve para você – uma ferramenta incrível para as aulas de matemática! (Claro, não recomendamos trapacear.)

O Qwen2-Math foi lançado em três versões: 72B, 7B e 1.5B. A versão 72B é um gênio da matemática, obtendo 7 pontos a mais que o GPT-4 no conjunto de dados MATH, representando uma melhoria de 9,6%. É como se você tirasse 145 pontos em matemática no vestibular, enquanto seu colega tirou apenas 132.

Ainda mais impressionante: a versão 7B, com menos de um décimo dos parâmetros, superou o modelo matemático de código aberto NuminaMath de 72B. Lembre-se que o NuminaMath ganhou um prêmio no primeiro AIMO global, prêmio concedido pelo "grande mestre" da matemática, Terence Tao.

O especialista sênior em algoritmos da Alibaba, Lin Junyang, anunciou entusiasmado que eles transformaram o modelo Qwen2 em um especialista em matemática. Como? Eles usaram um "suplemento cerebral matemático" especial – um corpus de dados matemáticos cuidadosamente projetado. Este "suplemento" contém uma grande quantidade de textos, livros, códigos, questões de exames de matemática de alta qualidade na internet, e até mesmo problemas matemáticos "criados" pelo próprio modelo Qwen2.

O resultado? Nos conjuntos de testes matemáticos clássicos GSM8K e MATH, o Qwen2-Math-72B superou o Llama-3.1 de 405B. Esses conjuntos de testes não são brincadeira; eles incluem problemas de álgebra, geometria, probabilidade, teoria dos números e outros desafios matemáticos.

Além disso, o Qwen2-Math também desafiou o conjunto de dados chinês CMATH e questões do vestibular. No conjunto de dados chinês, até mesmo a versão 1.5B superou o Llama3.1 de 70B. E, independentemente da versão, o desempenho foi significativamente melhor em comparação com o modelo base Qwen2 de mesmo tamanho.

Parece que o "Tongyi Qianwen" realmente criou um gênio da matemática! Podemos perguntar a ele sobre problemas de matemática no futuro? Mas lembre-se: esta é apenas uma ferramenta. Não se deixe enganar por sua inteligência; você ainda precisa praticar suas habilidades matemáticas!

Endereço para experimentar online: https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo

OpenAI Lança o GPT-4O-Audio-Preview: Áudio que 'Entende' Emoções!

A OpenAI lidera novamente a inovação em inteligência artificial com o lançamento do novo modelo gpt-4o-audio-preview. Este modelo demonstra capacidades surpreendentes na geração e análise de áudio, abrindo novas possibilidades para a interação humano-computador. Vamos explorar os recursos deste modelo inovador e suas potenciais aplicações. As principais funcionalidades do gpt-4o-audio-preview incluem três aspectos: primeiro, ele pode gerar respostas de voz naturais e fluidas com base em texto, fornecendo suporte para aplicativos como assistentes de voz e atendimento virtual.

Novo modelo OpenAI gpt-4o-2024-08-06 e gpt-4o-mini com suporte a saída estruturada

A OpenAI adicionou a funcionalidade de saída estruturada à sua API, garantindo que a saída gerada esteja totalmente em conformidade com o esquema JSON predefinido, melhorando significativamente a confiabilidade da API e a precisão dos aplicativos. Este recurso não apenas define a estrutura do JSON, mas também garante a precisão da saída. Simultaneamente, houve uma redução de preços, com o custo de entrada reduzido pela metade e o custo de saída reduzido em 1/3. A introdução da saída estruturada resolveu as limitações do esquema JSON em garantir que a saída esteja em conformidade com uma estrutura específica, melhorando significativamente o desempenho do modelo em relação à saída estruturada. Através de inovações tecnológicas, como restrições...

OpenAI lança novo modelo gpt-4o-64k-output-alpha: GPT-4o API agora suporta até 64K de saída

O principal destaque do novo modelo gpt-4o-64k-output-alpha da OpenAI é a capacidade de gerar uma saída de até 64K tokens de uma só vez, ideal para produzir conteúdo rico e detalhado, atendendo às necessidades de redação, programação e análise de dados complexos. No entanto, este recurso aumenta o preço da API, custando US$ 18 por milhão de tokens de saída, em comparação com US$ 6 por milhão de tokens de entrada. Essa medida visa equilibrar os altos custos computacionais e incentivar o uso responsável desta poderosa ferramenta. O modelo é uma ferramenta valiosa para os campos da criação e da pesquisa.

Notícias e Informações de IA

Modelo Matemático Qwen2 Math Demo do Tongyi Qianwen Lançado, Versão 72B Supera o GPT-4

AIbase基地

Notícias de IA Relacionadas Recomendadas

OpenAI Lança o GPT-4O-Audio-Preview: Áudio que 'Entende' Emoções!

Novo modelo OpenAI gpt-4o-2024-08-06 e gpt-4o-mini com suporte a saída estruturada

OpenAI lança novo modelo gpt-4o-64k-output-alpha: GPT-4o API agora suporta até 64K de saída