Boletim Diário de IA: O Baidu ERNIE 4.5 Turbo será lançado em 25 de abril; O Google lança o novo protocolo de agente inteligente A2A; O Vídeo Número combate o uso indevido de ferramentas de IA em transmissões ao vivo

Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1、Baidu anuncia: o modelo de linguagem grande Wenxin 4.5 Turbo será lançado em 25 de abril

A Baidu anunciou que lançará o modelo de linguagem grande Wenxin 4.5 Turbo na conferência Create em 25 de abril. Embora os detalhes específicos ainda não tenham sido divulgados, o setor está ansioso pela novidade. Os modelos Wenxin 4.5 e Wenxin X1 foram lançados no mês passado e disponibilizados gratuitamente aos usuários, demonstrando o profundo acúmulo da Baidu no campo da IA. O Wenxin 4.5 apresenta um desempenho excepcional na capacidade de compreensão multimodal, e o preço da chamada da API é extremamente competitivo, atraindo a atenção de muitos desenvolvedores e empresas.

【Resumo AiBase:】
🚀 O modelo de linguagem grande Wenxin 4.5 Turbo será lançado na conferência Create em 25 de abril, detalhes específicos serão revelados posteriormente.
💡 O modelo de linguagem grande Wenxin 4.5 apresenta um excelente desempenho na capacidade de compreensão multimodal, e o preço da chamada da API é apenas 1% do GPT 4.5.
🌟 O fundador da Baidu, Robin Li, disse que o modelo de linguagem grande Wenxin 4.5 será o melhor modelo da história da Baidu.

2、Mudança gigante no agente de IA! O Google lança o protocolo A2A de código aberto, permitindo a "conversa" livre entre agentes inteligentes

O Google Cloud lançou o novo protocolo de código aberto Agent2Agent (A2A), com o objetivo de promover a colaboração e a troca de informações entre diferentes agentes de IA. Este protocolo, por meio de métodos de comunicação padronizados, quebra as barreiras entre os agentes e resolve o problema dos silos de informações. Os princípios de design do protocolo A2A incluem suporte a tarefas de longo prazo, segurança padrão e independência de modalidade, garantindo sua aplicabilidade em aplicativos de IA complexos.

【Resumo AiBase:】
🚀 O protocolo A2A promove a colaboração e a troca de informações perfeita entre agentes de IA de diferentes fabricantes, quebrando os silos de informações.
🔒 Este protocolo é construído com base em padrões existentes, suporta segurança empresarial e simplifica o processo de integração.
🌐 Mais de 50 parceiros tecnológicos suportam o protocolo A2A, promovendo aplicações mais amplas da IA nas empresas.

3、WeChat: Operação especial para lidar com o uso indevido de ferramentas de IA em transmissões ao vivo

O Centro de Segurança de Criação de Vídeos do WeChat lançou recentemente um anúncio, lançando uma operação especial para lidar com o uso indevido de ferramentas de IA por alguns apresentadores em transmissões ao vivo. Esses comportamentos não apenas enganam os espectadores, mas também infringem os direitos de imagem de outras pessoas e violam as normas operacionais relevantes. A plataforma tomará medidas punitivas de acordo com a gravidade da violação para garantir um ambiente de transmissão saudável e seguro. Ao mesmo tempo, a plataforma incentiva o uso razoável da tecnologia de IA para melhorar a eficiência do trabalho, mas rejeita firmemente comportamentos de ganho indevido.

【Resumo AiBase:】
🚫 Alguns apresentadores usam ferramentas de IA de forma imprópria em transmissões ao vivo, enganando os espectadores e infringindo direitos de imagem.
⚖️ Os apresentadores precisam solicitar credenciais de transmissão ao vivo; se usarem ferramentas de IA para alterar sua aparência facial, isso será considerado uma violação.
📢 Os usuários podem relatar comportamentos ilegais por meio da função de reclamação, e a plataforma os processará em tempo hábil.

4、ByteDance lança código aberto Multi-SWE-bench, impulsionando a atualização inteligente de código de modelos de linguagem grandes

A equipe de modelos de linguagem grandes Doubao da ByteDance lançou recentemente o Multi-SWE-bench de código aberto, o primeiro conjunto de dados de referência de reparo de código multilíngue, com o objetivo de melhorar a avaliação da capacidade de correção automática de bugs de modelos de linguagem grandes. Em comparação com o SWE-bench anterior, o Multi-SWE-bench não apenas abrange Python, mas também adiciona seis linguagens, como Java e TypeScript, construindo 1632 tarefas reais e introduzindo um mecanismo de classificação de dificuldade.

【Resumo AiBase:】
🛠️ Multi-SWE-bench é o primeiro conjunto de dados de referência de reparo de código multilíngue, cobrindo 7 linguagens de programação principais.
📊 O conjunto de dados contém 1632 tarefas reais, que foram rigorosamente selecionadas e verificadas manualmente para garantir a confiabilidade da qualidade.
🤖 Os experimentos mostram que o desempenho dos modelos de linguagem grandes na correção de Python é aceitável, mas a taxa de correção em outras linguagens é inferior a 10%.

5、JD Retail lança o primeiro modelo de linguagem grande de séries temporais de bilhões de níveis TimeHF, que pode prever as vendas de produtos

A equipe de tecnologia da JD Retail lançou com sucesso o modelo de linguagem grande de previsão de vendas de séries temporais de bilhões de níveis TimeHF, que melhorou significativamente a previsão de vendas por meio da tecnologia de aprendizado por reforço com feedback humano, com uma precisão acima de 10%. O TimeHF apresentou um desempenho excepcional em cenários de reposição automática da JD e superou os níveis do setor em vários conjuntos de dados públicos, tornando-se um novo marco na previsão de séries temporais.

【Resumo AiBase:】
🛠️ O modelo TimeHF é baseado na tecnologia de aprendizado por reforço com feedback humano, com uma precisão de previsão melhorada em mais de 10%, reduzindo significativamente a incerteza da previsão da demanda.
📊 A equipe da JD integrou um conjunto de dados de alta qualidade de 1,5 bilhão de amostras, construindo um conjunto de dados complexos sem precedentes, que estabeleceu a base para o treinamento do modelo.
🚀 O TimeHF alcançou resultados SOTA em vários conjuntos de dados públicos, mostrando um desempenho mais forte de amostra zero e precisão de previsão, e já está sendo aplicado no sistema de cadeia de suprimentos da JD.

6、O Google Firebase Studio surge: plataforma de desenvolvimento unificada impulsionada por IA faz sua estréia impressionante

O recém-lançado Firebase Studio do Google é uma plataforma de desenvolvimento em nuvem que integra várias ferramentas de desenvolvimento, com o objetivo de simplificar o processo de desenvolvimento por meio da tecnologia de IA. Ele fornece uma experiência de desenvolvimento unificada, suportando soluções de processo completo de ideia a implantação, especialmente no campo do desenvolvimento móvel. Embora esteja atualmente em fase de visualização, seus poderosos recursos e política de teste gratuita permitem que os desenvolvedores desenvolvam projetos com mais facilidade, prenunciando uma mudança no ecossistema de programação futuro.

【Resumo AiBase:】
🛠️ O Firebase Studio integra várias ferramentas de desenvolvimento, fornecendo uma experiência de desenvolvimento unificada e suporte para construção rápida de aplicativos.
🌐 A plataforma possui um emulador de celular embutido, permitindo que os desenvolvedores depurem aplicativos iOS e Android diretamente na nuvem, melhorando a eficiência do desenvolvimento móvel.
🔍 Atualmente está em fase de visualização, a estabilidade do recurso ainda precisa ser melhorada, e no futuro será necessário equilibrar a diferença entre serviços gratuitos e pagos.
Link de detalhes:https://top.aibase.com/tool/firebase-studio

7、De texto a personagens complexos: o OmniSVG, o modelo de linguagem grande de geração de SVG mais poderoso, surgiu!

O lançamento do OmniSVG marca um grande avanço na tecnologia de geração de SVG, combinando modelos avançados de linguagem visual e um inovador tokenizador SVG, melhorando muito a eficiência e a qualidade da geração. O modelo não apenas suporta a geração de SVG a partir de texto e imagens, mas também pode gerar personagens de anime complexos, mostrando alta flexibilidade e qualidade. O surgimento do OmniSVG trouxe novas possibilidades para os campos de design gráfico e desenvolvimento web, promovendo o desenvolvimento da comunidade AIGC.

【Resumo AiBase:】
🌟 O OmniSVG é um modelo de geração de SVG avançado desenvolvido conjuntamente pela StepFun e pela Universidade de Fudan, com capacidades excepcionais de geração multimodal.
📊 O novo conjunto de dados MMSVG-2M lançado contém 2 milhões de recursos SVG e fornece um protocolo de avaliação padronizado, promovendo o desenvolvimento da tecnologia de geração de SVG.
🚀 O SVG gerado pelo OmniSVG não apenas tem excelente efeito visual, mas também é editável, adequado para fluxos de trabalho de design profissional.
Link de detalhes:https://omnisvg.github.io

8、O Google lança o kit de desenvolvimento de agente de código aberto: ADK faz sua estréia impressionante, liderando uma nova onda de desenvolvimento de agentes de IA

O Agent Development Kit (ADK) lançado pelo Google em 9 de abril de 2025 marca um grande avanço no desenvolvimento de agentes de IA. Como uma estrutura de código aberto, o ADK visa simplificar a construção e a gestão de sistemas multiagentes, suportando desenvolvimento e implantação flexíveis. Seu design modular e recursos de interação multimodal permitem que os desenvolvedores criem agentes de forma mais natural, enquanto a integração profunda com os serviços do Google Cloud melhora a eficiência dos aplicativos empresariais.

【Resumo AiBase:】
🚀 O ADK é uma estrutura de desenvolvimento de agente de código aberto lançada pelo Google, com o objetivo de simplificar a construção e a gestão de sistemas multiagentes.
🎤 Suporta interação multimodal, com recursos de fluxo de áudio e vídeo bidirecional, melhorando a capacidade de diálogo natural do agente.
🌐 Integração profunda com os serviços do Google Cloud, suporte a protótipos rápidos e implantação perfeita, reduzindo a barreira tecnológica.

9、Veo 2 faz sua estréia impressionante na API Gemini: a revolução da geração de vídeo de IA começa oficialmente

O modelo de geração de vídeo Veo2 da Google, por meio da API Gemini, está aberto a desenvolvedores, marcando uma nova fase na tecnologia de geração de vídeo de IA. Este modelo é conhecido por sua geração de vídeo de alta fidelidade e resposta precisa a instruções complexas, suportando geração de texto para vídeo e imagem para vídeo. Os desenvolvedores podem integrar esta API de forma flexível para explorar as amplas possibilidades comerciais e criativas. No entanto, também surgiram discussões sobre a autenticidade do conteúdo e a atribuição de direitos autorais, e o Google incorporou marcas d'água nos vídeos gerados para reduzir o risco de uso indevido.

【Resumo AiBase:】
🎥 Veo2 está aberto por meio da API Gemini, suportando geração de texto para vídeo e imagem para vídeo, impulsionando o desenvolvimento da tecnologia de geração de vídeo de IA.
💡 Os desenvolvedores podem integrar o Veo2 de forma flexível por meio da API para explorar aplicativos diversificados de vídeos curtos personalizados e experiências de histórias interativas.
⚖️ A saída de alta autenticidade leva a discussões sobre a autenticidade do conteúdo e os direitos autorais, e o Google incorpora marcas d'água para reduzir o risco de uso indevido.
Link de detalhes:https://ai.google.dev/gemini-api/docs/video

10、Anthropic lança serviço de assinatura premium Claude Max, com taxa mensal de até US$ 200

A Anthropic lançou recentemente um plano de assinatura Claude Max, com o objetivo de atender às necessidades de usuários premium de serviços de inteligência artificial. Este plano oferece duas opções de preços, US$ 100 e US$ 200 por mês, com restrições de uso significativamente melhoradas, atraindo mais usuários. Embora atualmente não haja um plano de uso ilimitado, a empresa está ativamente explorando outras fontes de receita, incluindo o projeto "Claude for Education" para o setor educacional.

【Resumo AiBase:】
🌟 O plano de assinatura Claude Max foi lançado, com uma taxa mensal de até US$ 200, projetado para usuários premium.
📈 Duas opções de preços, com restrições de uso significativamente melhoradas, atraindo mais usuários.
🎓 Explorando o projeto "Claude for Education", focando nas necessidades de IA no setor educacional.

11、Lançamento do OminiControl Art: Refinando os estilos artísticos de GPT-4o, como o Studio Ghibli, para o modelo FLUX

Em 9 de abril de 2025, o lançamento da tecnologia OminiControl Art marca um grande avanço no campo da criação de arte de IA. Esta tecnologia, por meio da estrutura OminiControl, combina o estilo artístico do GPT-4o da OpenAI com o modelo FLUX.1, fornecendo aos usuários uma ferramenta eficiente e elegante para gerar imagens artísticas de alta qualidade. Seu conceito de design enfatiza simplicidade e praticidade, permitindo que até mesmo usuários comuns possam usá-lo facilmente, promovendo uma maior integração entre IA e arte.

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

Boletim Diário de IA: O Baidu ERNIE 4.5 Turbo será lançado em 25 de abril; O Google lança o novo protocolo de agente inteligente A2A; O Vídeo Número combate o uso indevido de ferramentas de IA em transmissões ao vivo

站长之家

Este artigo é do AIbase Daily