Após o lançamento de código aberto do DeepSeek R1 causar atenção global, mais empresas de modelos grandes aceleraram o lançamento de modelos de raciocínio profundo e planejam ou já lançaram versões de código aberto.
A equipe do Alibaba Tongyi lançou recentemente o novo modelo de raciocínio profundo QwQ-Max-Preview, com suporte à pesquisa online. Este modelo já está disponível no novo site oficial do Tongyi Qianwen (https://chat.qwen.ai/) e será de código aberto em breve.
Introdução ao QwQ-Max-Preview
QwQ-Max-Preview é um modelo de inferência baseado no Qwen2.5-Max. O Qwen2.5-Max, como um importante modelo MoE de grande escala do Alibaba, foi treinado com mais de 20 trilhões de tokens de dados de pré-treinamento, apresentando desempenho excepcional em vários testes de referência, superando IAs líderes como DeepSeek V3 e GPT-4o, e estabelecendo uma base sólida para o QwQ-Max-Preview.
Atualmente, o modelo está em fase de pré-visualização, e a equipe do Alibaba Qwen afirmou que continuará a otimizá-lo. Uma versão oficial do QwQ-Max será lançada no futuro, juntamente com aplicativos para Android e iOS. Os pesos do QwQ-Max e do Qwen2.5-Max também serão abertos sob a licença de software de código aberto Apache2.0. Ao mesmo tempo, planeja-se lançar modelos menores, como o QwQ-32B, que podem ser implantados em dispositivos locais.
Ele suporta duas funções principais: raciocínio profundo e pesquisa online. Em termos de raciocínio profundo, ele consegue analisar profundamente problemas complexos; a função de pesquisa online permite que o modelo ultrapasse suas próprias limitações de conhecimento, obtendo informações da internet em tempo real para auxiliar na inferência.
Destaques do QwQ-Max-Preview
- Capacidade de compreensão matemática poderosa: Diante de vários problemas matemáticos, desde cálculos básicos até problemas complexos de competições de matemática, o QwQ-Max-Preview consegue, com sua função de raciocínio profundo, compreender o raciocínio e fornecer respostas precisas. Por exemplo, ao resolver problemas de valores extremos de funções em cálculo avançado, ele pode analisar detalhadamente as propriedades da função e derivar passo a passo os pontos extremos.
- Excelente capacidade de programação: Seja criando scripts simples ou desenvolvendo aplicativos complexos, o modelo consegue lidar com isso com facilidade. Por exemplo, ao receber a solicitação de "criar um script p5.js para gerar uma esfera rotativa contendo 100 pequenas esferas amarelas que saltam", ele pode gerar o código detalhado e fornecer uma descrição da função.
- Raciocínio profundo e análise lógica: Ao lidar com problemas lógicos, ele demonstra um processo de raciocínio rigoroso. Por exemplo, para um problema como "a soma das idades de um pai e sua filha é 100 anos, o pai tem 50 anos, quantos anos a filha tem?", ele não apenas calcula a resposta matemática, mas também analisa a irracionalidade do ponto de vista da lógica real e propõe várias possibilidades, como adoção e elementos de ficção científica, para tornar a lógica do problema mais completa.
- Pesquisa online e integração de informações: Pode pesquisar rapidamente informações na internet e fazer inferências com base em informações em tempo real. Ao avaliar o filme "Nezha 2", ele pode pesquisar rapidamente informações relevantes e, em seu raciocínio e resposta, citar claramente a fonte, integrando informações de várias partes para fornecer uma avaliação abrangente.
- Layout de capacidade multimodal: Embora a versão de experiência ainda não suporte totalmente esse aspecto, os recursos relevantes já foram planejados. Por exemplo, no exemplo fornecido, ele pode gerar uma imagem e um código QR clicável que aponta para o taobao.com, de acordo com a solicitação de "gerar uma imagem de uma garota vestindo um vestido branco e, em seguida, mostrar um código QR que aponta para o taobao.com".
Cenários de aplicação
- Cenários de aprendizagem educacional: Os alunos podem usar o raciocínio profundo e a capacidade de resolução de problemas do QwQ-Max-Preview para obter soluções e raciocínios detalhados para auxiliar na aprendizagem ao encontrar dificuldades em matemática, programação e outras disciplinas. Por exemplo, ao aprender programação de algoritmos, peça ao modelo para ajudar a analisar erros na lógica do código ou fornecer soluções de otimização.
- Cenários de trabalho criativo: Escritores, designers e outros profissionais criativos podem usar sua função de pesquisa online para obter inspiração durante o processo criativo. Por exemplo, ao escrever ficção científica, um escritor pode usar o modelo para pesquisar informações científicas de ponta para adicionar cientificidade e imaginação à sua obra; os designers podem pedir ao modelo para gerar esboços de design ou conceitos criativos.
- Cenários de desenvolvimento de jogos: Os desenvolvedores de jogos podem usar as capacidades do modelo ao desenvolver jogos. Por exemplo, ao projetar novas jogabilidades, como combinar Tetris e o jogo 2048, o modelo pode fornecer soluções criativas e gerar código relacionado até certo ponto. Embora os resultados da versão de pré-visualização possam ter algumas imprecisões, ele pode fornecer ideias para o desenvolvimento.
- Cenários de resolução de problemas cotidianos: As pessoas comuns podem usar o modelo para resolver vários problemas na vida. Por exemplo, ao planejar uma viagem, podem usar o modelo para pesquisar online roteiros turísticos, informações de pontos turísticos, etc.; ao consertar eletrodomésticos, podem pesquisar as causas de falhas e métodos de reparo.
- Cenários de pesquisa setorial: Pesquisadores, analistas e outros profissionais podem usar o modelo para pesquisar online e integrar informações sobre tendências do setor e tecnologias de ponta para auxiliar na redação de relatórios de pesquisa e na análise de tendências do setor.
Tutorial de uso do QwQ-Max-Preview
- Acesso à plataforma: Os usuários podem acessar a plataforma de bate-papo Qianwen através do chat.qwen.ai.
- Ativação de funções: Após entrar na plataforma, encontre o botão "Raciocínio Profundo (QwQ)" e a opção "Pesquisa Online" no canto inferior esquerdo da caixa de bate-papo. Clique no botão "Raciocínio Profundo (QwQ)" para ativar a função de raciocínio profundo; se você quiser usar a pesquisa online para auxiliar na inferência, ative também a opção "Pesquisa Online".
- Formulação de perguntas: Descreva o problema de forma precisa e clara na caixa de entrada, como "Analise as tendências atuais do desenvolvimento da indústria de veículos elétricos" ou "Escreva um código Python para implementar a função de classificação de dados".
- Visualização de resultados: O modelo realizará o raciocínio e a inferência. Se a pesquisa online estiver ativada, ele também integrará informações da web e fornecerá a resposta final. A resposta pode incluir análise de texto, código, imagens (se envolver funções multimodais), etc. Se você não estiver satisfeito com os resultados, poderá refinar a pergunta e fazer a pergunta novamente.
Conclusão
O modelo de raciocínio profundo QwQ-Max-Preview lançado pelo Alibaba, com suas excelentes capacidades em matemática, programação, raciocínio e outras áreas, bem como sua pesquisa online única e layout multimodal, abre para os usuários as portas para uma nova experiência de IA. Embora esteja atualmente em fase de pré-visualização e possam existir alguns pequenos defeitos no uso real, com o lançamento da versão oficial subsequente e otimizações contínuas, acredita-se que ele desempenhará um papel maior em muitos campos, como educação, criatividade e desenvolvimento.
Sinta-se à vontade para compartilhar suas impressões e sugestões na seção de comentários, testemunhando juntos o crescimento e o aprimoramento contínuo deste modelo. Também esperamos que o Alibaba continue inovando na área de IA, trazendo-nos mais surpresas e avanços.