Modelos de série Qwen2.5 de código aberto do Alibaba Tongyi Qianwen: Qwen2-VL-72B se compara ao GPT-4

AIbase基地

Publicado emNotícias e Informações de IA · 3 minutos de leitura · Sep 19, 2024

1.7k

A equipe do Tongyi Qianwen anunciou o lançamento do Qwen2.5, a mais recente adição à família Qwen, três meses após o lançamento do Qwen2. Este lançamento representa possivelmente um dos maiores lançamentos de código aberto da história, incluindo o modelo de linguagem universal Qwen2.5, e os modelos Qwen2.5-Coder e Qwen2.5-Math, especializados em programação e matemática, respectivamente.

Os modelos da série Qwen2.5 foram pré-treinados em um novo conjunto de dados de grande escala, contendo até 18 trilhões de tokens. Em comparação com o Qwen2, os novos modelos demonstram melhorias significativas na aquisição de conhecimento, capacidade de programação e capacidade matemática. Os modelos suportam o processamento de textos longos, podendo gerar até 8.000 tokens, mantendo o suporte para mais de 29 idiomas.

微信截图_20240919080229.png

微信截图_20240919080238.png

O código aberto da série Qwen2.5 utiliza a licença Apache2.0 e oferece versões de diferentes tamanhos para atender às diversas necessidades de aplicação. Além disso, a equipe do Tongyi Qianwen também lançou em código aberto o modelo Qwen2-VL-72B, com desempenho comparável ao GPT-4.

Os novos modelos apresentam melhorias significativas na execução de instruções, geração de textos longos, compreensão de dados estruturados e geração de saídas estruturadas. Especialmente nas áreas de programação e matemática, os modelos Qwen2.5-Coder e Qwen2.5-Math, treinados em conjuntos de dados especializados, demonstram capacidades superiores em suas respectivas áreas.

Experiência com os modelos da série Qwen2.5:

Conjunto Qwen2.5: https://modelscope.cn/studios/qwen/Qwen2.5

Criador da Manus, Ji Yichao: Produtos Manus são desenvolvidos com base no modelo de linguagem grande Qwen da Alibaba

O produto Manus, um agente de IA lançado pela startup chinesa Monica, recentemente causou furor na plataforma X. Hoje, seu fundador, Ji Yichao, divulgou mais detalhes técnicos do produto nas redes sociais. De acordo com Ji Yichao, Manus é desenvolvido com base no modelo de linguagem grande Qwen da Alibaba e utiliza vários modelos de ajuste fino para alcançar suas funcionalidades exclusivas. Essa notícia não apenas gerou discussões na indústria sobre a origem da tecnologia da Manus, mas também aumentou o interesse da comunidade global de IA em seu potencial. Ji Yichao

CSN Steel integra com sucesso o modelo de linguagem grande DeepSeek-R1, impulsionando a transformação digital

A CSN Steel deu um passo importante em sua jornada de transformação digital, anunciando recentemente em sua plataforma de interação a integração bem-sucedida do modelo de linguagem grande DeepSeek-R1. A empresa afirmou que, no futuro, se dedicará a promover a profunda integração entre tecnologia digital e economia real, usando isso como base para reformas abrangentes, buscando acelerar a construção de ativos de dados e explorar o valor potencial dos dados. Os esforços da CSN Steel para promover a manutenção inteligente representam uma estratégia crucial em um mercado competitivo. Com a integração do modelo de linguagem grande DeepSeek-R1, o 'Mensageiro CSN Steel'...

Notícias e Informações de IA

Modelos de série Qwen2.5 de código aberto do Alibaba Tongyi Qianwen: Qwen2-VL-72B se compara ao GPT-4

AIbase基地

Notícias de IA Relacionadas Recomendadas

Centro de Computação de Guangzhou acessa o grande modelo de linguagem Ali Tongyi Qianwen QwQ-32B

Criador da Manus, Ji Yichao: Produtos Manus são desenvolvidos com base no modelo de linguagem grande Qwen da Alibaba

Em apenas quatro semanas! A Foxconn lança o modelo de linguagem grande em chinês FoxBrain

CSN Steel integra com sucesso o modelo de linguagem grande DeepSeek-R1, impulsionando a transformação digital