Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do setor de IA, com foco em desenvolvedores, para ajudá-lo a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA clique para saber mais: https://top.aibase.com/
1、O primeiro agente inteligente universal do mundo faz sucesso, o código de convite do Manus é negociado por 50.000 yuans
O primeiro agente inteligente universal do mundo, Manus, atraiu ampla atenção do setor de tecnologia. O Manus possui a capacidade de pensar e executar tarefas complexas de forma independente, capaz de entregar resultados completos, demonstrando uma poderosa versatilidade. Ele não apenas pode lidar com tarefas cotidianas, mas também realizar pesquisas de mercado aprofundadas, planejamento de viagens personalizado e muitas outras tarefas. No mercado de segunda mão, o código de convite do Manus varia de 999 yuans a 50.000 yuans, com alguns vendedores afirmando não aceitar negociações, mostrando a escassez do produto.
【AiBase destaca:】
🚀 O Manus possui a capacidade de pensar e executar tarefas complexas de forma independente, demonstrando uma poderosa versatilidade e capacidade de execução.
📊 Em várias áreas, como pesquisa de mercado e planejamento de viagens, os casos de uso do Manus demonstram sua praticidade e eficiência.
🏆 O Manus estabeleceu um novo recorde no teste de referência GAIA, com desempenho técnico muito superior aos produtos concorrentes, demonstrando sua posição de liderança.
Link para detalhes:https://manus.im/
2、Alibaba lança o modelo de inferência de grande linguagem de código aberto QwQ-32B, com desempenho comparável ao DeepSeek-R1 e menor necessidade de memória de vídeo
A equipe Qwen da Alibaba lançou o modelo de linguagem grande de código aberto QwQ-32B, com o objetivo de melhorar seu desempenho em tarefas de resolução de problemas complexos por meio do aprendizado por reforço. Com base em 32 bilhões de parâmetros e um comprimento de contexto estendido de 131.072 tokens, o modelo pode competir com modelos de maior parâmetro em testes de referência de matemática e programação, ao mesmo tempo em que requer menos memória de vídeo.
【AiBase destaca:】
🚀 O QwQ-32B utiliza a tecnologia de aprendizado por reforço para melhorar a capacidade de resolver problemas complexos.
💡 Em testes de referência de matemática e programação, seu desempenho é comparável ao de modelos com maior número de parâmetros, com menor necessidade de memória de vídeo.
🧠 Possui comprimento de contexto estendido e capacidades agentivas, e continuará explorando o potencial do aprendizado por reforço no futuro.
Link para detalhes:https://qwenlm.github.io/blog/qwq-32b/
3、OpenAI anuncia que o GPT-4.5 será gradualmente disponibilizado para todos os usuários do ChatGPT Plus
A OpenAI anunciou recentemente que seu mais recente modelo de inteligência artificial, o GPT-4.5, será gradualmente disponibilizado para os usuários do ChatGPT Plus. Embora o modelo tenha apresentado uma melhoria significativa na capacidade de diálogo, ainda apresenta deficiências em raciocínios complexos. O custo de uso é alto, atingindo US$ 150 por milhão de tokens, o que levanta preocupações sobre sua adoção generalizada.
【AiBase destaca:】
💬 O GPT-4.5 é o maior modelo de inteligência artificial lançado pela OpenAI e será gradualmente disponibilizado para os usuários do ChatGPT Plus.
⚖️ Embora o GPT-4.5 tenha apresentado uma melhoria significativa na capacidade de diálogo, ainda apresenta deficiências em raciocínios complexos.
💰 O custo de uso do GPT-4.5 é alto, atingindo US$ 150 por milhão de tokens, o que levanta preocupações sobre sua adoção generalizada.
4、Doubao lança o modo de raciocínio profundo: visualização da cadeia de lógica de IA, novo avanço na busca e resposta a perguntas
O modo de raciocínio "pensamento profundo" lançado pela ByteDance para seu assistente de IA Doubao melhora a confiança e a transparência do usuário na IA por meio de uma cadeia de lógica visual. Essa tecnologia é baseada no modelo Doubao 1.5, combinada com avanços tecnológicos em modelos de raciocínio profundo, melhorando a inteligência e a humanidade da IA, indicando amplas perspectivas em áreas como perguntas e respostas, busca, escrita e leitura.
【AiBase destaca:】
🔍 O modo de pensamento profundo melhora a experiência do usuário ao mostrar a cadeia de lógica completa da IA.
🤖 Esse modo é baseado no modelo Doubao 1.5, usando algoritmos RL e otimização de engenharia para melhorar a inteligência da IA.
📈 O novo recurso indica amplas perspectivas de desenvolvimento da IA em vários campos, com uma melhoria significativa na experiência do usuário.
5、Lançamento do LTX-Video 0.9.5: suporte a licenças comerciais, geração de vídeo de IA de código aberto atinge um novo nível
O lançamento da versão 0.9.5 do LTX-Video marca um grande avanço na tecnologia de geração de vídeo de IA de código aberto. Ele não apenas suporta licenças comerciais, permitindo que empresas e desenvolvedores individuais usem o modelo em projetos comerciais, mas também introduz suporte a quadros-chave, melhorando a flexibilidade e a qualidade da geração de vídeo. Além disso, o modelo também apresentou melhorias significativas em resolução e velocidade de geração, atendendo melhor às necessidades de narrativas complexas.
【AiBase destaca:】
🌟 O principal destaque é o suporte a licenças comerciais, expandindo as perspectivas de aplicação.
🎥 Introdução do suporte a quadros-chave, melhorando a flexibilidade da geração de vídeo.
📈 Melhoria significativa na resolução e velocidade de geração, atendendo às necessidades de narrativas complexas.
6、Sistema de conversão de texto em fala Spark-TTS: suporte a clonagem de voz de amostra zero e controle granular
O Spark-TTS é um sistema avançado de conversão de texto em fala que atraiu ampla atenção da comunidade de IA por sua capacidade de clonagem de voz de amostra zero e controle granular de voz. Construído com base no Qwen2.5, o sistema simplifica o processo de geração de áudio, aumenta a eficiência e suporta a geração multilíngue, sendo particularmente adequado para a produção de audiolivros. Sua arquitetura técnica utiliza um codec de fluxo único BiCodec para garantir que a qualidade da voz seja natural e controlável, permitindo que os usuários ajustem as características da voz conforme necessário.
【AiBase destaca:】
🎤 Clonagem de voz de amostra zero: sem necessidade de dados de treinamento específicos para gerar a voz do locutor, adequado para aplicativos personalizados.
⚙️ Controle granular de voz: os usuários podem ajustar com precisão a velocidade e o tom da fala para atender a diferentes necessidades.
🌍 Geração multilíngue: suporta vários idiomas, mantendo alta naturalidade e precisão, expandindo a aplicabilidade global.
Link para detalhes:https://github.com/SparkAudio/Spark-TTS
7、Google lança a versão de prévia do Whisk Animate: transforma imagens em curtos vídeos animados de 8 segundos
O Google lançou a versão de prévia do Whisk Animate em sua plataforma experimental de IA, Google Labs, permitindo que os usuários usem o modelo avançado Veo2 para transformar imagens estáticas do Whisk em clipes de vídeo dinâmicos de 8 segundos. Esse novo recurso rapidamente gerou discussões nas redes sociais, com feedback positivo dos usuários, mostrando seu potencial no setor criativo. O lançamento do Whisk Animate marca uma transformação mais simples e eficiente de designs estáticos em conteúdo dinâmico, consolidando ainda mais a vantagem competitiva do Google no campo da IA generativa.
【AiBase destaca:】
🎥 O Whisk Animate usa o modelo Veo2 para transformar imagens estáticas em vídeos dinâmicos de 8 segundos, mostrando a flexibilidade da geração de animações.
🌟 O feedback dos usuários tem sido positivo, com alguns testadores iniciais chamando-o de "muito impressionante", mostrando seu potencial criativo.
🖼️ O lançamento do Whisk Animate oferece novas ferramentas para o setor criativo, simplificando o processo de criação de vídeos curtos e design de anúncios.
8、Cohere lança o novo modelo de IA multimodal Aya Vision, disponível em duas versões: 32B e 8B
Lançado pelo laboratório de pesquisa sem fins lucrativos da Cohere, o Aya Vision é um modelo de IA multimodal líder que pode executar várias tarefas de linguagem e visão. Disponibilizado gratuitamente via WhatsApp, o modelo visa promover o acesso à tecnologia para pesquisadores globais. O Aya Vision está disponível em duas versões, 32B e 8B, superando modelos concorrentes de maior escala. Além disso, a Cohere também lançou uma nova ferramenta de avaliação de referência, AyaVisionBench, para lidar com a crise atual de avaliação no setor de IA.
【AiBase destaca:】
🌟 O modelo Aya Vision é considerado pela Cohere como o melhor do setor, capaz de executar várias tarefas de linguagem e visão.
💡 O Aya Vision está disponível em duas versões, 32B e 8B, superando modelos concorrentes de maior escala.
🔍 A Cohere também lançou uma nova ferramenta de avaliação de referência, AyaVisionBench, para melhorar os problemas de avaliação de modelos de IA.
Link para detalhes:https://cohere.com/blog/aya-vision
9、O grupo Douyin procura fornecedores de rotulagem de dados de IA
Em 6 de março, o grupo Douyin divulgou um anúncio para recrutar fornecedores de rotulagem de dados de IA de alta qualidade para atender às suas crescentes necessidades de negócios. A contratação visa principalmente empresas com recursos verticais abundantes, especialmente nas áreas de saúde, direito e educação. As empresas participantes devem ser pessoas jurídicas independentes, com capital social não inferior a 1 milhão de yuans, boa reputação social e não serão aceitas inscrições de consórcios. Essa estratégia visa melhorar a qualidade do conteúdo e a capacidade de serviço de dados, impulsionando a competição e a inovação do setor.
【AiBase destaca:】
🌟 O grupo Douyin está recrutando fornecedores de rotulagem de dados de IA, com capital social exigido não inferior a 1 milhão de yuans.
📄 As empresas participantes devem ser pessoas jurídicas independentes, com boa reputação social e não serão aceitas inscrições de consórcios.
🚀 A contratação visa atender ao rápido crescimento do grupo Douyin na área de rotulagem de dados de IA e impulsionar o desenvolvimento do setor.
10、OpenAI lança agente de IA "nível doutorado", com mensalidade de até US$ 20.000
A OpenAI anunciou recentemente o lançamento de um agente de IA chamado "nível doutorado", projetado para atender às necessidades de alta demanda de setores como finanças, saúde e manufatura. O agente de IA tem uma mensalidade de até US$ 20.000 por mês, oferecendo vários tipos de serviços, com preços baseados no valor econômico criado para os clientes. Embora o alto custo tenha gerado algumas piadas, a OpenAI claramente está mirando empresas de grande porte como clientes-alvo, em vez de usuários individuais.
【AiBase destaca:】
💰 A mensalidade do agente de IA varia de US$ 2.000 a US$ 20.000 por mês, com preços baseados no valor econômico que ele cria para os clientes.
🏢 A OpenAI está mirando empresas de grande porte como clientes-alvo, permitindo que as empresas paguem por vaga de funcionário, reduzindo a barreira de entrada.
✈️ O agente de IA visa concluir tarefas automaticamente com a mínima intervenção humana, como encontrar informações de voo automaticamente e concluir o pagamento.
11、A App Store da Apple está prestes a lançar resumos de avaliações de aplicativos gerados por IA, facilitando o acesso ao feedback do usuário
A Apple anunciou que introduzirá um recurso de resumo de avaliações de aplicativos gerado por IA no próximo iOS 18.4. Esse recurso visa fornecer aos usuários um resumo conciso das avaliações de aplicativos, ajudando-os a obter rapidamente os destaques e informações-chave do aplicativo. Os resumos serão gerados por um modelo de linguagem grande e atualizados semanalmente, inicialmente na App Store dos EUA.
【AiBase destaca:】
🌟 A Apple lançará um recurso de resumo de avaliações de aplicativos gerado por IA no iOS 18.4 para ajudar os usuários a entender rapidamente o feedback do aplicativo.