Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1、Baidu anuncia: o modelo de linguagem grande Wenxin 4.5 Turbo será lançado em 25 de abril

A Baidu anunciou que lançará o modelo de linguagem grande Wenxin 4.5 Turbo na conferência Create em 25 de abril. Embora os detalhes específicos ainda não tenham sido divulgados, o setor está ansioso pela novidade. Os modelos Wenxin 4.5 e Wenxin X1 foram lançados no mês passado e disponibilizados gratuitamente aos usuários, demonstrando o profundo acúmulo da Baidu no campo da IA. O Wenxin 4.5 apresenta um desempenho excepcional na capacidade de compreensão multimodal, e o preço da chamada da API é extremamente competitivo, atraindo a atenção de muitos desenvolvedores e empresas.

image.png

【Resumo AiBase:】

🚀 O modelo de linguagem grande Wenxin 4.5 Turbo será lançado na conferência Create em 25 de abril, detalhes específicos serão revelados posteriormente.

💡 O modelo de linguagem grande Wenxin 4.5 apresenta um excelente desempenho na capacidade de compreensão multimodal, e o preço da chamada da API é apenas 1% do GPT 4.5.

🌟 O fundador da Baidu, Robin Li, disse que o modelo de linguagem grande Wenxin 4.5 será o melhor modelo da história da Baidu.

2、Mudança gigante no agente de IA! O Google lança o protocolo A2A de código aberto, permitindo a "conversa" livre entre agentes inteligentes

O Google Cloud lançou o novo protocolo de código aberto Agent2Agent (A2A), com o objetivo de promover a colaboração e a troca de informações entre diferentes agentes de IA. Este protocolo, por meio de métodos de comunicação padronizados, quebra as barreiras entre os agentes e resolve o problema dos silos de informações. Os princípios de design do protocolo A2A incluem suporte a tarefas de longo prazo, segurança padrão e independência de modalidade, garantindo sua aplicabilidade em aplicativos de IA complexos.image.png

【Resumo AiBase:】

🚀 O protocolo A2A promove a colaboração e a troca de informações perfeita entre agentes de IA de diferentes fabricantes, quebrando os silos de informações.

🔒 Este protocolo é construído com base em padrões existentes, suporta segurança empresarial e simplifica o processo de integração.

🌐 Mais de 50 parceiros tecnológicos suportam o protocolo A2A, promovendo aplicações mais amplas da IA nas empresas.

3、WeChat: Operação especial para lidar com o uso indevido de ferramentas de IA em transmissões ao vivo

O Centro de Segurança de Criação de Vídeos do WeChat lançou recentemente um anúncio, lançando uma operação especial para lidar com o uso indevido de ferramentas de IA por alguns apresentadores em transmissões ao vivo. Esses comportamentos não apenas enganam os espectadores, mas também infringem os direitos de imagem de outras pessoas e violam as normas operacionais relevantes. A plataforma tomará medidas punitivas de acordo com a gravidade da violação para garantir um ambiente de transmissão saudável e seguro. Ao mesmo tempo, a plataforma incentiva o uso razoável da tecnologia de IA para melhorar a eficiência do trabalho, mas rejeita firmemente comportamentos de ganho indevido.

image.png

【Resumo AiBase:】

🚫 Alguns apresentadores usam ferramentas de IA de forma imprópria em transmissões ao vivo, enganando os espectadores e infringindo direitos de imagem.

⚖️ Os apresentadores precisam solicitar credenciais de transmissão ao vivo; se usarem ferramentas de IA para alterar sua aparência facial, isso será considerado uma violação.

📢 Os usuários podem relatar comportamentos ilegais por meio da função de reclamação, e a plataforma os processará em tempo hábil.

4、ByteDance lança código aberto Multi-SWE-bench, impulsionando a atualização inteligente de código de modelos de linguagem grandes

A equipe de modelos de linguagem grandes Doubao da ByteDance lançou recentemente o Multi-SWE-bench de código aberto, o primeiro conjunto de dados de referência de reparo de código multilíngue, com o objetivo de melhorar a avaliação da capacidade de correção automática de bugs de modelos de linguagem grandes. Em comparação com o SWE-bench anterior, o Multi-SWE-bench não apenas abrange Python, mas também adiciona seis linguagens, como Java e TypeScript, construindo 1632 tarefas reais e introduzindo um mecanismo de classificação de dificuldade.

image.png

【Resumo AiBase:】

🛠️ Multi-SWE-bench é o primeiro conjunto de dados de referência de reparo de código multilíngue, cobrindo 7 linguagens de programação principais.

📊 O conjunto de dados contém 1632 tarefas reais, que foram rigorosamente selecionadas e verificadas manualmente para garantir a confiabilidade da qualidade.

🤖 Os experimentos mostram que o desempenho dos modelos de linguagem grandes na correção de Python é aceitável, mas a taxa de correção em outras linguagens é inferior a 10%.

5、JD Retail lança o primeiro modelo de linguagem grande de séries temporais de bilhões de níveis TimeHF, que pode prever as vendas de produtos

A equipe de tecnologia da JD Retail lançou com sucesso o modelo de linguagem grande de previsão de vendas de séries temporais de bilhões de níveis TimeHF, que melhorou significativamente a previsão de vendas por meio da tecnologia de aprendizado por reforço com feedback humano, com uma precisão acima de 10%. O TimeHF apresentou um desempenho excepcional em cenários de reposição automática da JD e superou os níveis do setor em vários conjuntos de dados públicos, tornando-se um novo marco na previsão de séries temporais.

image.png

【Resumo AiBase:】

🛠️ O modelo TimeHF é baseado na tecnologia de aprendizado por reforço com feedback humano, com uma precisão de previsão melhorada em mais de 10%, reduzindo significativamente a incerteza da previsão da demanda.

📊 A equipe da JD integrou um conjunto de dados de alta qualidade de 1,5 bilhão de amostras, construindo um conjunto de dados complexos sem precedentes, que estabeleceu a base para o treinamento do modelo.

🚀 O TimeHF alcançou resultados SOTA em vários conjuntos de dados públicos, mostrando um desempenho mais forte de amostra zero e precisão de previsão, e já está sendo aplicado no sistema de cadeia de suprimentos da JD.

6、O Google Firebase Studio surge: plataforma de desenvolvimento unificada impulsionada por IA faz sua estréia impressionante

O recém-lançado Firebase Studio do Google é uma plataforma de desenvolvimento em nuvem que integra várias ferramentas de desenvolvimento, com o objetivo de simplificar o processo de desenvolvimento por meio da tecnologia de IA. Ele fornece uma experiência de desenvolvimento unificada, suportando soluções de processo completo de ideia a implantação, especialmente no campo do desenvolvimento móvel. Embora esteja atualmente em fase de visualização, seus poderosos recursos e política de teste gratuita permitem que os desenvolvedores desenvolvam projetos com mais facilidade, prenunciando uma mudança no ecossistema de programação futuro.

image.png

【Resumo AiBase:】

🛠️ O Firebase Studio integra várias ferramentas de desenvolvimento, fornecendo uma experiência de desenvolvimento unificada e suporte para construção rápida de aplicativos.

🌐 A plataforma possui um emulador de celular embutido, permitindo que os desenvolvedores depurem aplicativos iOS e Android diretamente na nuvem, melhorando a eficiência do desenvolvimento móvel.

🔍 Atualmente está em fase de visualização, a estabilidade do recurso ainda precisa ser melhorada, e no futuro será necessário equilibrar a diferença entre serviços gratuitos e pagos.

Link de detalhes:https://top.aibase.com/tool/firebase-studio

7、De texto a personagens complexos: o OmniSVG, o modelo de linguagem grande de geração de SVG mais poderoso, surgiu!

O lançamento do OmniSVG marca um grande avanço na tecnologia de geração de SVG, combinando modelos avançados de linguagem visual e um inovador tokenizador SVG, melhorando muito a eficiência e a qualidade da geração. O modelo não apenas suporta a geração de SVG a partir de texto e imagens, mas também pode gerar personagens de anime complexos, mostrando alta flexibilidade e qualidade. O surgimento do OmniSVG trouxe novas possibilidades para os campos de design gráfico e desenvolvimento web, promovendo o desenvolvimento da comunidade AIGC.

image.png

【Resumo AiBase:】

🌟 O OmniSVG é um modelo de geração de SVG avançado desenvolvido conjuntamente pela StepFun e pela Universidade de Fudan, com capacidades excepcionais de geração multimodal.

📊 O novo conjunto de dados MMSVG-2M lançado contém 2 milhões de recursos SVG e fornece um protocolo de avaliação padronizado, promovendo o desenvolvimento da tecnologia de geração de SVG.

🚀 O SVG gerado pelo OmniSVG não apenas tem excelente efeito visual, mas também é editável, adequado para fluxos de trabalho de design profissional.

Link de detalhes:https://omnisvg.github.io

8、O Google lança o kit de desenvolvimento de agente de código aberto: ADK faz sua estréia impressionante, liderando uma nova onda de desenvolvimento de agentes de IA

O Agent Development Kit (ADK) lançado pelo Google em 9 de abril de 2025 marca um grande avanço no desenvolvimento de agentes de IA. Como uma estrutura de código aberto, o ADK visa simplificar a construção e a gestão de sistemas multiagentes, suportando desenvolvimento e implantação flexíveis. Seu design modular e recursos de interação multimodal permitem que os desenvolvedores criem agentes de forma mais natural, enquanto a integração profunda com os serviços do Google Cloud melhora a eficiência dos aplicativos empresariais.image.png

【Resumo AiBase:】

🚀 O ADK é uma estrutura de desenvolvimento de agente de código aberto lançada pelo Google, com o objetivo de simplificar a construção e a gestão de sistemas multiagentes.

🎤 Suporta interação multimodal, com recursos de fluxo de áudio e vídeo bidirecional, melhorando a capacidade de diálogo natural do agente.

🌐 Integração profunda com os serviços do Google Cloud, suporte a protótipos rápidos e implantação perfeita, reduzindo a barreira tecnológica.

9、Veo 2 faz sua estréia impressionante na API Gemini: a revolução da geração de vídeo de IA começa oficialmente

O modelo de geração de vídeo Veo2 da Google, por meio da API Gemini, está aberto a desenvolvedores, marcando uma nova fase na tecnologia de geração de vídeo de IA. Este modelo é conhecido por sua geração de vídeo de alta fidelidade e resposta precisa a instruções complexas, suportando geração de texto para vídeo e imagem para vídeo. Os desenvolvedores podem integrar esta API de forma flexível para explorar as amplas possibilidades comerciais e criativas. No entanto, também surgiram discussões sobre a autenticidade do conteúdo e a atribuição de direitos autorais, e o Google incorporou marcas d'água nos vídeos gerados para reduzir o risco de uso indevido.

image.png

【Resumo AiBase:】

🎥 Veo2 está aberto por meio da API Gemini, suportando geração de texto para vídeo e imagem para vídeo, impulsionando o desenvolvimento da tecnologia de geração de vídeo de IA.

💡 Os desenvolvedores podem integrar o Veo2 de forma flexível por meio da API para explorar aplicativos diversificados de vídeos curtos personalizados e experiências de histórias interativas.

⚖️ A saída de alta autenticidade leva a discussões sobre a autenticidade do conteúdo e os direitos autorais, e o Google incorpora marcas d'água para reduzir o risco de uso indevido.

Link de detalhes:https://ai.google.dev/gemini-api/docs/video

10、Anthropic lança serviço de assinatura premium Claude Max, com taxa mensal de até US$ 200

A Anthropic lançou recentemente um plano de assinatura Claude Max, com o objetivo de atender às necessidades de usuários premium de serviços de inteligência artificial. Este plano oferece duas opções de preços, US$ 100 e US$ 200 por mês, com restrições de uso significativamente melhoradas, atraindo mais usuários. Embora atualmente não haja um plano de uso ilimitado, a empresa está ativamente explorando outras fontes de receita, incluindo o projeto "Claude for Education" para o setor educacional.

image.png

【Resumo AiBase:】

🌟 O plano de assinatura Claude Max foi lançado, com uma taxa mensal de até US$ 200, projetado para usuários premium.

📈 Duas opções de preços, com restrições de uso significativamente melhoradas, atraindo mais usuários.

🎓 Explorando o projeto "Claude for Education", focando nas necessidades de IA no setor educacional.

11、Lançamento do OminiControl Art: Refinando os estilos artísticos de GPT-4o, como o Studio Ghibli, para o modelo FLUX

Em 9 de abril de 2025, o lançamento da tecnologia OminiControl Art marca um grande avanço no campo da criação de arte de IA. Esta tecnologia, por meio da estrutura OminiControl, combina o estilo artístico do GPT-4o da OpenAI com o modelo FLUX.1, fornecendo aos usuários uma ferramenta eficiente e elegante para gerar imagens artísticas de alta qualidade. Seu conceito de design enfatiza simplicidade e praticidade, permitindo que até mesmo usuários comuns possam usá-lo facilmente, promovendo uma maior integração entre IA e arte.