Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Saiba mais: https://top.aibase.com/

1、Lançamento do novo modelo multimodal de ponta a ponta Qwen2.5-Omni da Ali Tongyi Qianwen

A equipe Aliyun Tongyi Qianwen lançou o Qwen2.5-Omni, um modelo multi-modal de ponta, projetado para processamento contínuo de texto, imagem, áudio e vídeo. O modelo emprega a inovadora arquitetura Thinker-Talker, permitindo interação em tempo real de áudio e vídeo e apresentando desempenho excepcional em tarefas multimodais. O Qwen2.5-Omni superou modelos unimodais e de código fechado existentes em vários benchmarks setoriais, demonstrando seu poderoso desempenho e amplo potencial de aplicação.

image.png

【Resumo AiBase:】

🛠️ O Qwen2.5-Omni é um novo modelo multimodal de ponta a ponta que suporta o processamento contínuo de texto, imagem, áudio e vídeo.

⚡ Emprega a arquitetura Thinker-Talker, permitindo resposta em tempo real, melhorando a naturalidade e estabilidade da geração de voz.

📊 Apresenta excelente desempenho no OmniBench de tarefas multimodais e superou modelos semelhantes em vários benchmarks setoriais.

Link para detalhes: https://chat.qwenlm.ai

2、OpenAI anuncia suporte ao padrão MCP da Anthropic

Sam Altman, CEO da OpenAI, anunciou que a empresa apoiará o protocolo de contexto do modelo (MCP) lançado pela concorrente Anthropic, projetado para melhorar a precisão e relevância das respostas de assistentes de IA em consultas específicas. A integração do MCP será aplicada a vários produtos OpenAI, incluindo o aplicativo de desktop do ChatGPT. O MCP permite que modelos de IA obtenham informações de várias fontes de dados, promovendo uma conexão bidirecional entre desenvolvedores e aplicativos de IA.

image.png

【Resumo AiBase:】

🌟 A OpenAI anuncia suporte ao padrão MCP da Anthropic para melhorar a qualidade da resposta do assistente de IA.

🔗 O MCP permite que modelos de IA obtenham informações de várias fontes de dados, construindo uma conexão bidirecional.

📈 Várias empresas já se juntaram ao suporte do MCP, impulsionando o desenvolvimento de padrões abertos.

Link para detalhes: https://openai.github.io/openai-agents-python/mcp/

3、Ideogram lança oficialmente a versão 3.0, quebrando barreiras em realismo e criatividade

O lançamento do Ideogram 3.0 marca um avanço significativo na tecnologia de geração de imagens, especialmente em termos de realismo, criatividade e consistência de estilo. O novo modelo não apenas alcançou um salto qualitativo na capacidade de renderização de texto, mas também suporta vários designs de paginação complexos, melhorando a experiência de criação do usuário. Seus novos recursos, como "Referência de Estilo" e "Estilo Aleatório", permitem que os usuários gerem rapidamente imagens de alta qualidade e diversificadas.

【Resumo AiBase:】

🌟 O Ideogram 3.0 alcança um avanço significativo em realismo e criatividade, tornando-se um marco importante no campo da geração de imagens.

🖋️ O novo modelo suporta paginação complexa e design multilíngue, gerando texto artístico claro e legível, melhorando os cenários de aplicação de design gráfico.

⚡ Através da otimização da arquitetura do algoritmo, a velocidade de geração do Ideogram 3.0 aumentou significativamente, oferecendo aos usuários uma experiência de criação mais eficiente.

4、Atualização importante do Kling AI: otimização de referência de várias imagens, aumento da velocidade de geração e lançamento do recurso de extensão de vídeo

O Kling AI (Kling) passou por uma atualização de recursos importante recentemente, melhorando significativamente a interface do usuário e a capacidade de criação. A interface atualizada é mais limpa e intuitiva, melhorando a experiência do usuário e ajudando os criadores a se concentrarem na criação de conteúdo. Além disso, a atualização do recurso de referência de várias imagens tornou a geração mais rápida e a compreensão semântica mais precisa. Os usuários podem expressar melhor suas intenções criativas carregando várias imagens.

【Resumo AiBase:】

⚡️ Aumento significativo na velocidade de geração, experiência do usuário mais fluida.

🖼️ O recurso de referência de várias imagens foi otimizado, permitindo a captura mais precisa da intenção criativa.

🎥 Lançamento do recurso de extensão de vídeo, adequado para criadores de vídeos curtos e usuários profissionais.

5、OpenAI está prestes a concluir um financiamento de US$ 40 bilhões liderado pela SoftBank

De acordo com o último relatório da Bloomberg, a OpenAI está prestes a concluir um financiamento de US$ 40 bilhões liderado pela SoftBank, tornando-se o maior financiamento da história do setor de inteligência artificial. Após o financiamento, a OpenAI terá um valor de mercado de US$ 300 bilhões, quase o dobro de sua avaliação em outubro de 2023. Este financiamento não apenas mostra o reconhecimento do mercado pela tecnologia de inteligência artificial, mas também reflete a confiança dos investidores no potencial futuro da OpenAI.

【Resumo AiBase:】

🌟 A OpenAI está prestes a concluir um financiamento de US$ 40 bilhões liderado pela SoftBank, tornando-se o maior financiamento da história da IA.

💰 Após o financiamento, a avaliação total da OpenAI atingirá US$ 300 bilhões, quase o dobro da avaliação de outubro de 2023.

🚀 Planos futuros incluem iniciar um financiamento de US$ 30 bilhões, com a SoftBank continuando a aumentar seus investimentos para apoiar ainda mais o desenvolvimento da OpenAI.

6、A plataforma Taobao inicia a governança de imagens falsas de IA, reprimindo severamente o uso de imagens falsas de IA para enganar os consumidores

A Taobao anunciou recentemente o lançamento de uma ação de governança de imagens falsas de IA em toda a plataforma para combater imagens enganosas geradas por IA, protegendo os direitos e interesses legítimos dos consumidores e comerciantes de marcas originais. Com o desenvolvimento da indústria de comércio eletrônico, as imagens falsas geradas por IA estão se tornando cada vez mais comuns, afetando seriamente a experiência de compra dos consumidores e a reputação dos comerciantes de marcas. A Taobao exige explicitamente que os comerciantes usem imagens reais de produtos e apela a toda a indústria para manter a justiça e transparência do ambiente de comércio eletrônico.

微信截图_20250327140103.png

【Resumo AiBase:】

🖼️ A Taobao lança uma ação de governança de imagens falsas de IA para combater imagens enganosas e proteger os direitos dos consumidores.

🚫 Regulamenta explicitamente que as imagens de produtos devem ser principalmente fotos reais, proibindo imagens compostas com distorções significativas.

🤝 Apela a toda a indústria, pedindo aos comerciantes que usem imagens geradas por IA de forma regulamentada e garantam a autenticidade das informações.

7、A receita anual da Perplexity, empresa de mecanismos de busca de IA, ultrapassa US$ 100 milhões

A Perplexity, uma startup de mecanismos de busca de inteligência artificial, anunciou recentemente que sua receita anual ultrapassou US$ 100 milhões, com o CEO Aravin Srinivas compartilhando a boa notícia no LinkedIn. Embora o produto ainda não esteja totalmente monetizado, a empresa cresceu 6,3 vezes no último ano. O plano Perplexity Pro oferecerá recursos mais ricos e está planejando levantar de US$ 500 milhões a US$ 1 bilhão, com expectativa de avaliação de US$ 18 bilhões.

【Resumo AiBase:】

💰 A receita anual da Perplexity ultrapassa US$ 100 milhões, com uma taxa de crescimento anual de 6,3 vezes.

📈 A empresa planeja levantar de US$ 500 milhões a US$ 1 bilhão, com uma avaliação de US$ 18 bilhões.

⚡ O modelo Sonar AI agora está disponível para todos os usuários Pro e afirma ser o mecanismo de inferência mais rápido do mundo.

8、O WHEE da Meitu integra o DeepSeek R1, otimizando prompts e preenchendo automaticamente palavras-chave

A integração bem-sucedida do gerador de material de IA WHEE da Meitu com o DeepSeek R1 marca um avanço significativo no campo da criação de IA. Esta colaboração visa usar a capacidade de design de prompt do DeepSeek para ajudar os usuários a gerar facilmente conteúdo de imagem de alta qualidade, mesmo sem formação profissional. O recurso de otimização de prompt do WHEE pode preencher automaticamente as palavras-chave, reduzindo a barreira de entrada para os usuários e promovendo a realização de ideias criativas.

image.png

【Resumo AiBase:】

🌟 O WHEE integra o DeepSeek R1, reduzindo a barreira de entrada para o uso de prompts para usuários sem formação profissional.

🎨 O recurso de otimização de prompt pode preencher automaticamente as palavras-chave, gerando conteúdo de texto rico.

🚀 Especialistas do setor apontam que esta tecnologia preenche a lacuna técnica entre a criatividade do usuário e as instruções profissionais.

9、OpenAI planeja construir um centro de dados e pode se tornar um dos maiores clientes de armazenamento do mundo

A OpenAI está considerando a construção de seu primeiro centro de dados, um plano que pode torná-la um dos maiores clientes de armazenamento do mundo. Espera-se que a OpenAI invista bilhões de dólares em hardware e software para atender à demanda de armazenamento de até 5 EB. Esta medida não apenas reduzirá a dependência de provedores de serviços em nuvem, mas também poderá reduzir os custos operacionais. Embora o projeto ainda esteja em fase de avaliação, envolvendo vários fatores, como viabilidade técnica e segurança de dados, o potencial da construção de um centro de dados próprio é notável.

【Resumo AiBase:】

🌐 A OpenAI está considerando a construção de seu primeiro centro de dados e pode se tornar um dos maiores clientes de armazenamento do mundo.

💰 Planeja adquirir hardware e software no valor de bilhões de dólares, com expectativa de necessidade de capacidade de armazenamento de 5 EB.

🔍 A construção de um centro de dados próprio ajudará a reduzir a dependência de provedores de serviços em nuvem e poderá economizar custos operacionais.

10、Dados sintéticos em ação! AccVideo realiza geração de vídeo de alta qualidade, com aumento de velocidade de 8,5 vezes

O AccVideo é uma tecnologia inovadora que melhora significativamente a velocidade de geração de modelos de difusão de vídeo, aumentando-a em 8,5 vezes. Através de um método de destilação inovador e um conjunto de dados sintéticos, o AccVideo não apenas melhora a eficiência de geração, mas também mantém a saída de vídeo de alta qualidade. Esta tecnologia traz novas oportunidades de desenvolvimento para o campo de geração de vídeo, mostrando um enorme potencial, especialmente em cenários de aplicação como geração de vídeo a partir de texto.

image.png

【Resumo AiBase:】

⚡ O AccVideo, através de um método de destilação inovador e um conjunto de dados sintéticos, aumentou com sucesso a velocidade de geração de vídeo em 8,5 vezes.

🎥 Esta tecnologia, mantendo o desempenho comparável ao modelo pré-treinado, pode gerar vídeos de alta qualidade com resolução de até 720x1280 e 24 fps.

🌟 A capacidade de geração eficiente do AccVideo oferece amplas perspectivas de aplicação para campos como geração de vídeo a partir de texto, expandindo as possibilidades de criação de vídeo.

Link para detalhes: https://top.aibase.com/tool/accvideo