Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, com foco em desenvolvedores, para ajudá-lo a entender as tendências tecnológicas e conhecer os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais: https://top.aibase.com/

1、DeepSeek lança atualização de estratégia de paralelismo no quarto dia de código aberto: tecnologias DualPipe e EPLB impulsionam a revolução do treinamento de modelos de grande porte

DeepSeek lançou uma estratégia de paralelismo otimizada no quarto dia de seu projeto de código aberto, com foco nos algoritmos de paralelismo de pipeline bidirecional DualPipe e no balanceador de carga dinâmico EPLB. Essas tecnologias visam resolver problemas centrais no treinamento de modelos de linguagem em larga escala, melhorando significativamente a eficiência computacional e o uso de recursos.

image.png

【Resumo AiBase:】

🔄 O algoritmo DualPipe implementa um pipeline de fluxo de dados bidirecional, aumentando a taxa de transferência de computação e sendo adequado para o treinamento de modelos com escala de parâmetros de bilhões a trilhões.

⚖️ O balanceador de carga dinâmico EPLB resolve o problema de especialistas populares em modelos de especialistas mistos, aumentando a taxa de utilização geral para mais de 92%.

📊 A ferramenta de otimização de sobreposição de computação e comunicação constrói um modelo de eficiência espaço-temporal, reduzindo o tempo de treinamento de ponta a ponta em cerca de 15%.

Link para detalhes:https://github.com/deepseek-ai/DualPipe

2、Alibaba inicia recrutamento de primavera de 2026, abrindo 3000 vagas, com quase 50% relacionadas à IA

A Alibaba iniciou oficialmente o recrutamento de estagiários para a primavera de 2026, abrindo mais de 3000 vagas, sendo quase 50% relacionadas à inteligência artificial. A proporção de vagas de IA é ainda maior em alguns departamentos, como 65% na AutoNavi e mais de 80% na Alibaba Cloud. Este recrutamento de primavera abrange vários departamentos, mostrando a importância dada pela Alibaba à tecnologia de IA e sua atenção contínua às vagas de tecnologia, especialmente na área de IA.

image.png

【Resumo AiBase:】

🤖 A Alibaba iniciou o recrutamento de estagiários para a primavera de 2026, abrindo 3000 vagas, com quase 50% relacionadas à IA.

📈 Em departamentos como AutoNavi e Alibaba Cloud, a proporção de vagas de IA é significativa, atingindo 65% e 80%, respectivamente.

💼 Os negócios de IA B2C da Alibaba já começaram a contratar em larga escala, com 90% das vagas concentradas em pesquisa e desenvolvimento de tecnologia e produtos de IA.

3、ElevenLabs lança o modelo de voz para texto Scribe, com precisão inovadora, atingindo 96,7% em inglês

A ElevenLabs lançou recentemente seu mais novo modelo de voz para texto, o Scribe v1, alegando ter atingido a maior precisão em várias línguas. O modelo suporta 99 idiomas e consegue distinguir com precisão até 32 falantes diferentes em ambientes de áudio complexos. O preço do Scribe é de US$ 0,40 por hora, com 50% de desconto nas próximas seis semanas.image.png

【Resumo AiBase:】

🌟 O Scribe v1 é o mais novo modelo de voz para texto da ElevenLabs, com precisão recorde em várias línguas.

🗣️ Suporta 99 idiomas e consegue distinguir até 32 falantes diferentes, adaptando-se a ambientes de áudio complexos.

💰 O preço atual é de US$ 0,40 por hora, com 50% de desconto nas próximas seis semanas; uma versão de baixa latência está em desenvolvimento.

Link para detalhes:https://elevenlabs.io/blog/meet-scribe

4、Microsoft lança os modelos multimodais e mini Phi-4, melhorando ainda mais o processamento de voz, visão e texto

A Microsoft lançou recentemente novos modelos da série Phi-4, incluindo o Phi-4 multimodal e o Phi-4 mini, melhorando significativamente a capacidade de processamento de aplicativos de IA. O modelo multimodal Phi-4 integra processamento de voz, visão e texto, com 56 milhões de parâmetros, apresentando excelente desempenho em vários testes de referência, especialmente em tarefas de reconhecimento automático de voz e tradução. O Phi-4 mini concentra-se no processamento de texto, com 38 milhões de parâmetros, apresentando desempenho igualmente excelente.

image.png

【Resumo AiBase:】

🎤 O modelo multimodal Phi-4 é o primeiro modelo de arquitetura unificada da Microsoft que integra processamento de voz, visão e texto, com 56 milhões de parâmetros, superando muitos concorrentes.

📊 O modelo multimodal Phi-4 apresenta excelente desempenho em processamento de visão e raciocínio matemático, conseguindo entender documentos e gráficos de forma eficaz e realizar reconhecimento óptico de caracteres.

📝 O modelo Phi-4 mini concentra-se no processamento de texto, com 38 milhões de parâmetros, apresentando desempenho excepcional em tarefas de raciocínio de texto e programação, superando vários modelos de linguagem grandes populares.

5、Hugging Face lança FastRTC: o desenvolvimento de aplicativos de voz e vídeo em tempo real torna-se muito mais fácil

A Hugging Face lançou recentemente o FastRTC, uma biblioteca Python de código aberto que visa simplificar o processo de desenvolvimento de aplicativos de IA de áudio e vídeo em tempo real. A biblioteca automatiza funções complexas de comunicação em tempo real, permitindo que os desenvolvedores criem aplicativos básicos em tempo real com poucas linhas de código, reduzindo significativamente o tempo de desenvolvimento.

image.png

【Resumo AiBase:】

🎉 A Hugging Face lança o FastRTC, uma biblioteca Python de código aberto que visa simplificar o desenvolvimento de aplicativos de IA de áudio e vídeo em tempo real.

⚡ O FastRTC consegue concluir em poucas linhas de código o que antes levava semanas, permitindo que até mesmo desenvolvedores Python existentes possam construir facilmente recursos de voz e vídeo.

🌟 O lançamento desta biblioteca representa uma grande oportunidade para o mundo da IA, promovendo formas mais naturais de interação humano-computador e ajudando as empresas a atender às necessidades dos usuários mais rapidamente.

Link para detalhes:https://huggingface.co/fastrtc

6、FLORA, a tela de IA baseada em nós: simplificando o fluxo de trabalho criativo, da análise de histórias à geração de conteúdo visual

A tela de IA baseada em nós lançada recentemente pela FLORA é uma ferramenta projetada para profissionais criativos, visando simplificar o fluxo de trabalho criativo integrando várias funções de IA. Seu núcleo é o sistema baseado em nós, onde os usuários podem criar nós independentes para lidar com tarefas diferentes. A análise de histórias e a geração de prompts, as ferramentas de design de personagens e os recursos de colaboração em equipe da FLORA tornam o trabalho criativo mais eficiente e flexível.

image.png

【Resumo AiBase:】

🖌️ O sistema baseado em nós permite que os usuários processem tarefas criativas independentemente, melhorando a eficiência do trabalho.

📖 As ferramentas de análise de histórias e design de personagens podem gerar prompts detalhados para uso com geradores de imagens de IA avançados.

🤝 Suporta colaboração em equipe em tempo real, com uma interface amigável, adequada para usuários com pouca experiência em tecnologia.

7、Em breve? OpenAI GPT-4.5 aparece na versão beta do aplicativo Android

A OpenAI está se preparando para lançar uma versão de visualização de seu modelo de linguagem de próxima geração, o GPT-4.5, gerando grande interesse. O modelo será lançado como uma opção experimental no aplicativo ChatGPT para Android, inicialmente disponível apenas para usuários com assinatura Pro. Embora as funções específicas ainda não estejam claras, espera-se que o GPT-4.5 se torne o sucessor da versão gratuita do ChatGPT, possivelmente com limites de conversação mais altos.

image.png

【Resumo AiBase:】

🚀 O GPT-4.5 está prestes a ser lançado, inicialmente para usuários com assinatura Pro.

🔍 O modelo aparece como uma opção experimental no aplicativo ChatGPT para Android, com funções específicas ainda não claras.

💰 A assinatura Pro custa US$ 200 por mês, oferecendo mais recursos e menos restrições.

8、O aplicativo de assistente inteligente de IA Doubao da ByteDance lança a função “Fotos em Movimento”

O aplicativo Doubao, da ByteDance, lançou a função “Fotos em Movimento”, que visa transformar fotos antigas estáticas em vídeos dinâmicos. Os usuários só precisam enviar uma foto e descrever a ação para realizar facilmente essa transformação. Esta função não apenas adiciona cores vibrantes às memórias dos usuários, mas também dá nova vida a momentos preciosos, refletindo a combinação de tecnologia e emoção.

image.png

【Resumo AiBase:】

📸 Esta função permite que os usuários transformem fotos antigas estáticas em vídeos dinâmicos vibrantes, atendendo à necessidade dos usuários de dinamizar fotos antigas.

💡 Fácil de usar, os usuários só precisam enviar uma foto e descrever as ações nela para gerar o efeito dinâmico.

❤️ O aplicativo Doubao espera, por meio desta função, ajudar os usuários a ter uma conversa que transcende o tempo e o espaço com seu eu passado, preservando momentos maravilhosos.

9、Modelo de texto para fala IndexTTS do Bilibili: suporta correção de pronúncia de caracteres chineses com pinyin, controle preciso de pausas

O modelo IndexTTS lançado pelo Bilibili é um sistema de texto para fala no estilo GPT baseado em XTTS e Tortoise, com a capacidade única de corrigir a pronúncia de caracteres chineses com pinyin e controle preciso de pausas. Após treinamento com dados de dezenas de milhares de horas, o IndexTTS apresentou excelente desempenho em termos de taxa de erro de palavras e avaliação de qualidade de áudio, superando vários sistemas TTS populares e demonstrando desempenho líder do setor.image.png

【Resumo AiBase:】

🌟 O IndexTTS é um modelo TTS no estilo GPT baseado em XTTS e Tortoise, capaz de corrigir a pronúncia de caracteres chineses e controlar pausas.

📊 O sistema foi treinado por dezenas de milhares de horas, superando vários sistemas TTS populares existentes e mostrando desempenho líder do setor.

🔍 O IndexTTS apresentou excelente desempenho em várias avaliações, com taxa de erro de palavras e qualidade de áudio superiores a outros modelos, mostrando suas fortes vantagens.

Link para detalhes:https://github.com/index-tts/index-tts

10、O Kuaishou Keling AI teve um aumento de 113% nos usuários globais de acesso mensal em janeiro

De acordo com os dados mais recentes, o número de usuários globais de acesso mensal do Kuaishou Keling AI aumentou 113% em janeiro. O UBS apontou que entretenimento e educação online são áreas centrais para aplicativos de IA, e o Kuaishou, com seu Keling AI de desenvolvimento próprio, está na liderança entre os modelos globais de geração de vídeo. Recentemente, o Kuaishou lançou uma função de referência de várias imagens, permitindo que os usuários enviem várias imagens de referência, melhorando ainda mais a experiência do usuário e a liberdade de criação.

image.png

【Resumo AiBase:】

📊 O Kuaishou Keling AI teve um aumento de 113% no número de usuários globais de acesso mensal em janeiro.

🎓 Entretenimento e educação online são cenários-chave para a implementação de IA.

🖼️ A nova função de referência de várias imagens do Keling AI permite que os usuários enviem várias imagens de referência.

11、Professor universitário diz que redações feitas com IA recebem nota zero

Com o rápido desenvolvimento da tecnologia de inteligência artificial, as ferramentas de IA tornaram-se assistentes para os universitários na realização de relatórios e trabalhos acadêmicos. No entanto, alguns professores universitários apontaram que há casos de má conduta acadêmica entre os alunos que dependem do conteúdo gerado por IA, e as universidades estão, portanto, implementando políticas que resultarão em uma nota zero para os alunos que apresentarem redações geradas por IA. Esta medida visa enfatizar a integridade acadêmica e se opor à dependência excessiva da tecnologia.

image.png

【Resumo AiBase:】

📚 Alguns professores universitários apontaram que há casos de má conduta acadêmica entre os alunos que dependem do conteúdo gerado por IA.

🚫 As universidades estão implementando políticas que resultarão em uma nota zero para os alunos que apresentarem redações geradas por IA.

🧠 Os internautas têm reações mistas, com apoio e preocupações coexistindo, enfatizando a importância da integridade acadêmica.

12、Jogadora de Go de 19 anos é severamente punida pela Associação Chinesa de Go por fraude com IA, recebendo uma suspensão de 8 anos