Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA Clique para saber mais: https://top.aibase.com/
1、A Alibaba anunciou suporte total ao protocolo MCP, seguida pela Tencent
Recentemente, o campo da inteligência artificial na China testemunhou uma mudança nos padrões tecnológicos, com o Model Context Protocol (MCP) tornando-se o padrão de fato para o ecossistema de IA doméstico. O suporte da Alibaba e da Tencent marca uma nova rodada de competição entre gigantes tecnológicos chineses na corrida global por padrões de IA. Como um protocolo de código aberto, o MCP simplifica a interação entre modelos de IA e ferramentas externas, melhorando a interoperabilidade.
【Resumo AiBase:】
🚀 A rápida ascensão do protocolo MCP destaca a necessidade urgente de protocolos padronizados pelas empresas de tecnologia chinesas.
🤝 O suporte da Alibaba e da Tencent acelerará a adoção do MCP na China, impulsionando a implementação de agentes de IA.
⚖️ A adoção do MCP enfrenta desafios, mas também pode gerar um novo ecossistema de desenvolvimento de IA, influenciando a competição tecnológica futura.
2、A Jieyue Xingchen lança um novo modelo de raciocínio multimodal - Step-R1-V-Mini
O Step-R1-V-Mini, lançado pela equipe de tecnologia Jieyue Xingchen, é um modelo de raciocínio multimodal inovador que representa um novo avanço no campo. O modelo suporta entrada de texto e imagem e saída de texto, possuindo excelente capacidade de seguir instruções e versatilidade. Ao adotar o aprendizado por reforço multimodal conjunto e o mecanismo de recompensa verificável, o Step-R1-V-Mini apresenta desempenho excepcional em raciocínio visual e lógica matemática, especialmente ocupando uma posição de destaque na classificação de raciocínio visual MathVision.
【Resumo AiBase:】
🧠 O Step-R1-V-Mini suporta entrada de texto e imagem e saída de texto, com boa capacidade de seguir instruções e versatilidade.
🔍 O modelo apresenta excelente desempenho na área de raciocínio visual, especialmente ocupando o primeiro lugar na China na classificação MathVision.
⚙️ Já está disponível no site da Jieyue AI e fornece interface API para desenvolvedores e pesquisadores.
Link para detalhes: https://yuewen.cn/chats/new
3、A Meitu WHEE lança o modelo de geração de imagens Miracle F1
O modelo de geração de imagens de IA Miracle F1, lançado recentemente pela plataforma WHEE, revolucionou o campo da criação de imagens de IA com sua qualidade excepcional de geração de imagens e compreensão profunda de conceitos complexos. O modelo não apenas gera imagens extremamente realistas, mas também apresenta excelente desempenho em compreensão semântica e diversidade de estilos, atendendo às necessidades de diferentes usuários. Os usuários podem experimentar essa magia visual através do site oficial da WHEE.
【Resumo AiBase:】
✨ O Miracle F1 gera imagens extremamente realistas, simulando os efeitos de luz e sombra e textura do mundo real.
🧠 O modelo compreende com precisão conceitos complexos, melhorando a eficiência e a precisão da criação, como se tivesse "leitura de mentes".
🌈 O Miracle F1 possui estilos diversos, podendo atender a diversas necessidades, como e-commerce, visuais de eventos e ilustrações.
4、Deep Research agora com Gemini 2.5 Pro: o modelo de IA mais inteligente do Google faz sua aparição
O Google anunciou que seu recurso Deep Research foi atualizado para a versão experimental do Gemini 2.5 Pro, demonstrando capacidades excepcionais de raciocínio e integração de informações. Essa inovação tecnológica atraiu ampla atenção do setor, marcando um marco importante para as ferramentas de pesquisa de IA. O Gemini 2.5 Pro não apenas melhorou a eficiência da pesquisa, mas também pode realizar análises abrangentes, alterando os métodos de pesquisa e ajudando os profissionais a se adaptarem às novas tecnologias. No futuro, o Google planeja expandir a gama de aplicações do Deep Research, fornecendo suporte mais inteligente para pesquisas acadêmicas e comerciais.
【Resumo AiBase:】
🚀 A atualização do Gemini 2.5 Pro melhorou significativamente a eficiência de pesquisa e a capacidade de análise do Deep Research, podendo lidar com tópicos complexos e gerar relatórios completos.
📊 O modelo apresentou desempenho excepcional em vários testes de referência, especialmente em tarefas de contexto longo, com uma janela de contexto de até 1 milhão de tokens, capaz de analisar grandes quantidades de dados.
🌐 Esse avanço tecnológico marca um marco importante para as ferramentas de pesquisa de IA e espera-se que cause mudanças revolucionárias na pesquisa acadêmica e comercial.
5、Novo modelo de código aberto DeepCoder: programação super eficiente, superando o modelo o1 da OpenAI
O modelo DeepCoder-14B-Preview, de código aberto pela Together AI e Agentica, com 14 bilhões de parâmetros, apresentou desempenho excepcional em testes de programação, superando o modelo o1 da OpenAI. O conteúdo de código aberto do modelo é amplo, incluindo pesos do modelo, dados de treinamento e métodos de treinamento, facilitando muito a pesquisa aprofundada dos desenvolvedores. Por meio do aprendizado por reforço distribuído e conjuntos de dados de alta qualidade, o DeepCoder apresentou melhorias significativas na eficiência de treinamento e na qualidade do código, demonstrando seu enorme potencial na área de programação de IA.
【Resumo AiBase:】
🌟 O modelo DeepCoder-14B-Preview apresentou desempenho excepcional, superando o modelo o1 da OpenAI.
📈 Conteúdo de código aberto amplo, incluindo pesos do modelo e dados de treinamento, facilitando a pesquisa dos desenvolvedores.
⚙️ O uso de várias tecnologias garante a qualidade dos dados e a eficiência do treinamento, melhorando significativamente o desempenho do modelo.
Link para detalhes: https://huggingface.co/agentica-org/DeepCoder-14B-Preview
6、Desempenho de raciocínio em novo salto! DeepSeek apresenta a tecnologia inovadora SPCT, tornando os grandes modelos mais compreensivos
A tecnologia de otimização crítica de princípios de atuação automática (SPCT), lançada pela DeepSeek AI, marca um grande avanço no campo dos grandes modelos de linguagem. Essa tecnologia visa construir modelos de recompensa de IA mais gerais e escaláveis, melhorando a capacidade de compreensão e resposta da IA em ambientes complexos. O SPCT resolve os desafios enfrentados pelos modelos de recompensa existentes em termos de flexibilidade de entrada, precisão, escalabilidade durante o raciocínio e escalabilidade de aprendizado por meio da geração dinâmica de princípios e comentários.
【Resumo AiBase:】
✨ A tecnologia SPCT visa melhorar a generalidade e a escalabilidade dos modelos de recompensa de IA, superando as limitações dos modelos existentes.
💡 Por meio da geração dinâmica de princípios e comentários, o SPCT melhora efetivamente o desempenho e a capacidade de raciocínio da IA em tarefas complexas.
📈 O DeepSeek-GRM-27B superou modelos tradicionais em vários testes de referência, mostrando maior qualidade de recompensa e escalabilidade durante o raciocínio.
Link para detalhes: https://arxiv.org/abs/2504.02495
7、Lançamento oficial da Anthropic! Relatório de uso da IA Claude por estudantes universitários divulgado
Este artigo discute o uso da inteligência artificial (IA) nos estudos universitários, especialmente o uso do Claude.ai. Ao analisar uma grande quantidade de dados de conversas anônimas, a pesquisa revela as preferências de uso da IA por estudantes de diferentes cursos e o papel da IA nos estudos. Embora a IA ofereça conveniência aos estudantes, também levanta preocupações sobre a terceirização das habilidades cognitivas, destacando os desafios e oportunidades enfrentados pelos educadores na era da IA.
【Resumo AiBase:】
📊 Os estudantes de cursos STEM são os primeiros a adotar as ferramentas de IA, sendo que a taxa de uso entre os estudantes de ciência da computação é significativamente maior do que em outras áreas.
🛠️ Os estudantes usam principalmente a IA para criação e análise, especialmente no design de conteúdo educacional e na resolução de problemas técnicos.
🤔 O uso da IA levanta preocupações sobre a terceirização das habilidades cognitivas dos estudantes, e os educadores devem se concentrar em como equilibrar o papel auxiliar da IA e o desenvolvimento das habilidades básicas dos estudantes.
8、A Amazon lança o modelo de voz de IA de nova geração Nova Sonic, capturando variações de tom, entonação e ritmo
O modelo de voz de IA Nova Sonic, lançado recentemente pela Amazon, visa melhorar o desempenho de seu assistente de voz Alexa +. O modelo gera respostas naturais e fluidas por meio do processamento local de voz, marcando um grande avanço na tecnologia de reconhecimento de voz. O Nova Sonic não apenas possui capacidade de reconhecimento de voz em ambientes complexos, mas também pode ajustar as respostas de acordo com o tom e o estilo do usuário, melhorando a experiência do usuário.
【Resumo AiBase:】
🌟 O Nova Sonic é o novo modelo de voz de IA da Amazon, projetado para melhorar o desempenho do Alexa +.
💰 O custo do modelo é 80% menor do que o GPT-4o da OpenAI, oferecendo mais opções aos desenvolvedores.
🔊 O Nova Sonic possui capacidade de reconhecimento de voz em ambientes complexos e pode processar solicitações de usuários de forma rápida e precisa.
Link para detalhes: https://www.aboutamazon.com/news/innovation-at-amazon/nova-sonic-voice-speech-foundation-model
9、O aplicativo móvel do Google NotebookLM está prestes a ser lançado
A ferramenta de pesquisa de IA NotebookLM do Google está prestes a lançar um aplicativo cliente móvel independente, marcando sua expansão da web para dispositivos móveis. Essa atualização proporcionará aos usuários uma experiência mais conveniente, atendendo à demanda por aplicativos móveis. Desde seu lançamento, o NotebookLM tem recebido ampla atenção por seus recursos inovadores, e o futuro aplicativo móvel integrará ainda mais a capacidade de pesquisa do Google, melhorando a eficiência do processamento de informações.
【Resumo AiBase:】
🚀 O NotebookLM lançará versões para iOS e Android, melhorando a conveniência de uso em dispositivos móveis.
🔍 O recurso "Discover Sources" foi adicionado, permitindo que os usuários pesquisem e integrem automaticamente o conteúdo da web em seus cadernos.
🎙️ No futuro, poderá integrar profundamente a capacidade de pesquisa do Google, permitindo a conversão de URLs em resumos e mapas mentais.
10、Tecnologia de geração de vídeo de IA TTT: pode gerar diretamente um vídeo completo de um minuto de animação de Tom e Jerry sem edição ou junção
Esta pesquisa gerou com sucesso um vídeo de animação de um minuto de "Tom e Jerry" por meio da introdução de uma camada de treinamento em tempo de teste, marcando um novo avanço na tecnologia de geração de vídeo de IA. A tecnologia apresentou excelente desempenho na coerência da imagem e na integridade da história, e não requer edição posterior, demonstrando o enorme potencial da IA na produção de conteúdo criativo. Embora existam algumas falhas, suas perspectivas de aplicação são amplas, e no futuro poderá mudar o modo de produção de vídeo.
【Resumo AiBase:】
🚀 Por meio da introdução da camada TTT, o modelo pode gerar um vídeo de animação completo de um minuto sem edição posterior.
🎨 O vídeo gerado apresenta excelente desempenho em termos de consistência temporal e coerência da história, aproximando-se da qualidade da animação tradicional.
💡 Essa tecnologia pode reduzir os custos de produção de vídeo, acelerar o processo criativo e ser expandida para conteúdo mais complexo no futuro.
Link para detalhes: https://test-time-training.github.io/video-dit/
11、Gabinete de Cibersegurança: até 31 de março de 2025, 346 serviços de IA generativa foram registrados
Em 8 de abril, o Gabinete de Cibersegurança de Xangai divulgou um comunicado revelando a situação do registro de serviços de inteligência artificial generativa até 31 de março de 2025. De acordo com as exigências do Gabinete de Cibersegurança da China, os departamentos de cibersegurança e as unidades relevantes estão promovendo conjuntamente o trabalho de registro de serviços de inteligência artificial generativa para promover a inovação e o uso regulamentado neste campo.
【Resumo AiBase:】