Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA Clique para saber mais: https://top.aibase.com/
1、OpenAI lança novo modelo de transcrição de voz gpt-4o-transcribe, com precisão de voz para texto em alta
A OpenAI lançou recentemente três novos modelos de voz, a saber: gpt-4o-transcribe, gpt-4o-mini-transcribe e gpt-4o-mini-tts, sendo o gpt-4o-transcribe o que mais chama a atenção. Este modelo apresenta um desempenho excepcional na área de transcrição de voz, com uma taxa de erro significativamente reduzida, atingindo 2,46% na transcrição em inglês. Além disso, o gpt-4o-transcribe suporta transcrição em diversos ambientes complexos e possui tecnologias de eliminação de ruído e detecção de atividade de voz semântica.
【AiBase destaca:】
🔊 A taxa de erro do gpt-4o-transcribe na transcrição em inglês é de apenas 2,46%, significativamente melhor que o modelo anterior, Whisper.
🌍 Suporta mais de 100 idiomas e mantém alta precisão em ambientes ruidosos e com diferentes sotaques.
💻 Os desenvolvedores podem integrar facilmente o novo modelo por meio da API, impulsionando o desenvolvimento de aplicativos de interação por voz.
Link para mais detalhes: https://top.aibase.com/tool/openai-fm
2、Pesquisa do Kuaishou com IA aprimorada: DeepSeek R1 totalmente integrado, experiência de pesquisa transformada!
O Kuaishou anunciou recentemente que sua função de pesquisa está totalmente integrada ao grande modelo DeepSeek R1. Essa iniciativa visa melhorar significativamente os resultados da pesquisa e a experiência do usuário, impulsionando o aumento da atividade do usuário. Ao mesmo tempo, o Kuaishou também está explorando ativamente o potencial de comercialização de cenários de pesquisa inteligente. Com a integração do DeepSeek, a plataforma de criação de conteúdo de IA do Kuaishou, "Ke Ling AI", tornou-se mais eficiente na geração de vídeos e imagens, permitindo que os usuários controlem o processo de criação com mais precisão e expandindo enormemente as possibilidades criativas.
【AiBase destaca:】
🚀 A função de pesquisa do Kuaishou já está totalmente integrada ao grande modelo DeepSeek R1, melhorando os resultados da pesquisa e a experiência do usuário.
💡 Com a integração do DeepSeek, a plataforma de criação de conteúdo de IA "Ke Ling AI" permite que os usuários gerem e otimizem prompts de forma mais eficiente.
🎥 A versão DeepSeek Inspiração está profundamente integrada ao "banco de palavras-chave inspiradoras" do Kuaishou, permitindo que os usuários controlem com precisão os elementos-chave da criação.
3、Claude lança função de pesquisa na web, fornecendo informações em tempo real e citações de fontes
A Anthropic está adicionando uma função de pesquisa na web ao seu assistente de IA, Claude, para fornecer informações mais atualizadas. Diferentemente dos mecanismos de busca tradicionais, o Claude transforma os resultados da busca em respostas conversacionais e indica com precisão as fontes de informação. Atualmente, essa função está disponível apenas para usuários pagos nos EUA, com planos de expansão para outros países e contas gratuitas no futuro.
【AiBase destaca:】
🌐 O Claude transforma os resultados da busca online em respostas conversacionais e indica as fontes de informação.
💰 Atualmente, a função de busca na web é destinada apenas a usuários pagos nos EUA, com planos de expansão para outros países.
⚖️ A redução do tráfego causada pelos robôs de busca representa um desafio para os sites que dependem do volume de acessos.
4、ByteDance lança estrutura de geração de imagens a partir de texto InfiniteYou: pode manter as características faciais, e a cena pode ser alterada à vontade
O InfiniteYou (InfU), lançado pela ByteDance, é uma ferramenta inovadora de geração de imagens que pode gerar imagens personalizadas de alta qualidade com base em descrições de texto fornecidas pelo usuário. Sua tecnologia principal, InfuseNet, por meio de uma estratégia de treinamento refinada, garante que as imagens geradas preservem as características de identidade do usuário, ao mesmo tempo em que permite a alteração flexível de cenários e conteúdo.
【AiBase destaca:】
🧑🚀 O InfiniteYou é um modelo de geração de imagens lançado pela ByteDance, capaz de gerar imagens personalizadas com base em descrições de texto.
🔧 A tecnologia principal, InfuseNet, por meio de treinamento refinado, garante que as imagens geradas preservem as características de identidade do usuário, permitindo ao mesmo tempo a alteração flexível de cenários.
🌐 Esta ferramenta é compatível com diversas ferramentas existentes, adequada para pesquisas acadêmicas, devendo seguir as licenças e regulamentos legais correspondentes.
Link para mais detalhes: https://top.aibase.com/tool/infiniteyou
5、Nova função do Tencent Yuanbao: Suporta análise de planilhas Excel complexas
A nova função lançada pelo Tencent Yuanbao melhora significativamente a conveniência do usuário no tratamento de planilhas Excel. O usuário precisa apenas fazer perguntas em linguagem natural, e o Yuanbao pode ler dados e realizar cálculos rapidamente, além de destacar informações importantes, simplificando os processos operacionais complexos do passado. Mesmo iniciantes no Excel podem lidar facilmente com a análise de dados.
【AiBase destaca:】
📝 A nova função permite que os usuários façam perguntas em linguagem natural, simplificando o processo de análise de dados do Excel.
⚡ O modelo Hun Yuan Turbo S pode processar tabelas complexas rapidamente, melhorando a eficiência da análise.
📱 Suporta operação em várias plataformas, permitindo que os usuários carreguem e analisem tabelas a qualquer hora e em qualquer lugar.
6、Krea AI lança função "Treinamento de Vídeo": permite treinar seu próprio estilo de vídeo exclusivo
A Krea AI lançou recentemente a nova função "Treinamento de Vídeo", que permite aos usuários treinar modelos de estilo de vídeo de IA exclusivos carregando imagens e vídeos pessoais. Essa função é baseada no modelo Wan2.1 e permite que os usuários aprendam estilos artísticos e movimentos dinâmicos específicos, melhorando significativamente a personalização e a flexibilidade da criação de conteúdo. Os usuários podem ajustar vários parâmetros conforme necessário, e os modelos de estilo gerados podem ser aplicados diretamente à plataforma Krea Video.
【AiBase destaca:】
📹 Os usuários podem carregar imagens e vídeos para treinar modelos exclusivos de estilo de vídeo de IA.
⚙️ Oferece uma experiência de operação flexível, permitindo que os usuários ajustem os parâmetros de treinamento para otimizar o desempenho do modelo.
🌟 Essa função abre novas possibilidades para os criadores de conteúdo, melhorando a eficiência da criação.
Link para mais detalhes: https://www.krea.ai/train
7、DomoAI lança função de geração de imagens de voz para personagens digitais: uma nova conquista na criação de conteúdo digital
A nova função lançada pela DomoAI permite aos usuários gerar personagens digitais falantes carregando voz e imagens, causando grande discussão e marcando uma importante inovação na criação de conteúdo digital. Essa função não apenas suporta sincronização labial, mas também pode gerar vídeos curtos de diferentes comprimentos, com destaque para o excelente suporte ao chinês, melhorando significativamente a flexibilidade e a eficiência da criação.
【AiBase destaca:】
🎤 Os usuários podem gerar rapidamente personagens virtuais falantes carregando voz e imagens, com suporte para várias opções de duração.
🚀 Essa função apresenta alta velocidade de geração e excelente suporte ao chinês, atendendo às necessidades de diferentes cenários.
🎨 A tecnologia inovadora da DomoAI reduzirá a barreira de entrada para a criação de conteúdo, impulsionando a profunda integração da IA com a indústria do entretenimento.
Link para mais detalhes: https://www.domoai.app/en/create/talking-avatar
8、Sider AI lança função Deep Research: pode simular automaticamente o comportamento de pesquisa humana e gerar relatórios interativos visualizados
A função Deep Research, lançada recentemente pela Sider AI, chamou a atenção por sua capacidade de simular o comportamento de pesquisa humana e gerar relatórios visualizados automaticamente. Essa função melhora a eficiência da pesquisa por meio de anotações em tempo real e fontes de informação transparentes, ao mesmo tempo em que oferece maior controle ao usuário.
【AiBase destaca:】
🤖 A função Deep Research pode simular o comportamento de pesquisa humana, acessar informações online automaticamente e gerar anotações em tempo real.
📊 Após a coleta de informações, essa função gera automaticamente uma página web visualizada interativamente, incluindo elementos como gráficos e fluxogramas.
🔍 Os usuários podem integrar perfeitamente a pesquisa automatizada e manual por meio da extensão do navegador, adequada para diversos cenários de pesquisa.
Link para mais detalhes: https://sider.ai/wisebase/deep-research
9、Estudante do ensino médio usa Minecraft para construir um site de avaliação de modelos de IA, com participação pública para julgar a qualidade dos modelos
Com o rápido desenvolvimento da tecnologia de inteligência artificial, a avaliação e comparação da capacidade dos modelos de IA generativos tornou-se um grande desafio. O site MC-Bench, usando o jogo Minecraft, oferece uma nova forma de avaliação. Os usuários podem votar em construções geradas por IA sem saber, uma ideia que não apenas aumenta a participação do público, mas também fornece uma experiência visual intuitiva para a avaliação de modelos de IA.
【AiBase destaca:】
🎮 O MC-Bench usa o Minecraft como plataforma de avaliação, permitindo que os usuários avaliem o desempenho dos modelos de IA por meio de votação.
👨🎓 Este projeto foi iniciado por um estudante do ensino médio e atraiu o apoio de várias empresas de IA de ponta, demonstrando a capacidade de inovação dos jovens.
🛠️ No futuro, o MC-Bench pode ser expandido para tarefas de IA mais complexas, tornando-se uma ferramenta eficaz para testar a capacidade de raciocínio da IA.
Link para mais detalhes: https://top.aibase.com/tool/mc-bench
10、Criado por ex-cientista do Google! Reka lança código aberto Reka Flash 3, com capacidade superior a Gemma 3 27B
A Reka AI lançou recentemente seu primeiro modelo de código aberto, o Reka Flash3, um modelo de raciocínio geral com 21 bilhões de parâmetros, que atraiu grande atenção na indústria. Apesar de ter menos parâmetros que alguns concorrentes, suas características de treinamento do zero e otimização profunda resultam em um desempenho excepcional. O Reka Flash3 não apenas possui forte capacidade de raciocínio, mas também suporta implantação de baixa latência e amigável a dispositivos, adequada para vários usos finais.
【AiBase destaca:】
🚀 O Reka Flash3 é um modelo de código aberto lançado pela Reka AI, fundada por ex-cientistas do Google DeepMind, com 21 bilhões de parâmetros e desempenho superior a muitos modelos de grande porte.
💡 Este modelo possui forte capacidade de raciocínio, suporta resolução de problemas complexos e raciocínio em várias etapas, adequado para diversos cenários de aplicativos inovadores.
📱 O Reka Flash3 apresenta baixa latência e implantação amigável a dispositivos, podendo no futuro fornecer serviços convenientes diretamente em dispositivos móveis.
Link para mais detalhes: https://top.aibase.com/tool/reka-flash-3
11、Shengshu Technology Vidu obtém autorização para adaptação de 7 curtas-metragens de IP de romances online de milhões de yuans
A plataforma de geração de vídeo de IA Vidu, da Beijing Shengshu Technology Co., Ltd., obteve recentemente autorização para adaptar 7 curtas-metragens de IP de romances online de milhões de yuans, marcando um novo marco no mercado de curtas-metragens de animação na China. Essas obras abrangem uma variedade de gêneros, como fantasia, ficção científica, artes marciais e romance urbano, com uma ampla base de fãs e um forte potencial de adaptação para cinema e televisão.
【AiBase destaca:】
🎬 Vidu obteve autorização para adaptar 7 curtas-metragens de IP de romances online de milhões de yuans, abrangendo diversos gêneros.
⚙️ A tecnologia de IA pode gerar automaticamente roteiros e cenas de vídeo, aumentando significativamente a eficiência da produção.
⏱️ O tempo de produção é reduzido de meses para semanas ou até dias, resolvendo o problema do alto custo de adaptação tradicional.
12、Lançado o primeiro modelo de grande porte de pediatria do mundo, impulsionando a atualização dos serviços médicos para crianças