Bem-vindo à seção 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do setor de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Saiba mais: https://top.aibase.com/

1. Lançamento global simultâneo do MiniMax Hélice de Voz, incluindo modelos como o T2A-01-Turbo

Em 20 de janeiro de 2025, a MiniMax, subsidiária da Shanghai Xiyu Technology Co., Ltd., lançou a versão atualizada do modelo de voz da série T2A-01, marcando mais um avanço importante em tecnologia de síntese de voz. A série inclui os modelos T2A-01-HD e T2A-01-Turbo, suportando 17 idiomas e mais de 300 tons de voz, atendendo às diversas necessidades de empresas e usuários individuais.

image.png

【Resumo AiBase:】

🎤 Os modelos de voz da série T2A-01 suportam 17 idiomas, oferecendo qualidade de áudio nítida e ritmo natural.

🌍 O Hélice de Voz está à frente de produtos similares em capacidade de síntese multilíngue e possui forte capacidade de compreensão emocional.

🎶 Os usuários podem escolher entre mais de 300 tons de voz e personalizá-los para atender às necessidades de diferentes cenários.

Link para detalhes: https://hailuoai.com/audio

2. ByteDance lança o Trae, um IDE de IA para desenvolvedores chineses, com desempenho comparável ao Cursor

O Trae, lançado pela ByteDance, é um ambiente de desenvolvimento integrado (IDE) de IA projetado especificamente para desenvolvedores chineses, com o objetivo de melhorar a experiência de programação desses usuários. O Trae resolve os inconvenientes encontrados pelos usuários chineses em ferramentas existentes, por meio da otimização completa da interface chinesa e do suporte a comentários de código. Além disso, o Trae integra modelos de IA avançados, fornecendo recursos de geração inteligente de código e otimização lógica.

image.png

【Resumo AiBase:】

💻 O IDE Trae é projetado para desenvolvedores chineses, otimizando a interface chinesa e o suporte a comentários de código, melhorando a experiência do usuário.

🤖 Integra modelos de IA populares como Claude3.5 e GPT-4o, com recursos de geração inteligente de código e otimização lógica.

🔧 Oferece um poderoso recurso Builder, permitindo que os usuários gerem projetos de código completos, mas requerendo a confirmação manual do código gerado pela IA.

Link para detalhes: https://top.aibase.com/tool/trae

3. Versão interativa do modelo de linguagem grande SenseNova da SenseTime liberada para uso comercial; conversação em áudio e vídeo em tempo real gratuita por tempo limitado

O lançamento oficial da versão interativa SenseNova-5o da SenseTime marca um avanço significativo no campo da IA. Este modelo possui poderosas capacidades de conversação em áudio e vídeo em tempo real, suporta memória de interação multimodal extra longa e pode registrar e lembrar com precisão o conteúdo da conversa do usuário. O SenseNova-5o também oferece configurações personalizadas para se adaptar a vários cenários de comunicação e já foi aplicado com sucesso em vários dispositivos inteligentes, demonstrando o potencial e a inovação da SenseTime em aplicações de tecnologia de IA.

image.png

【Resumo AiBase:】

🎤 O SenseNova-5o possui memória de interação multimodal extra longa, capaz de registrar com precisão a conversa do usuário e recuperar rapidamente o conteúdo relevante.

💬 Este modelo demonstra uma eficiente capacidade de diálogo em múltiplas rodadas, com atraso de interação reduzido para 2 segundos, quase indistinguível da comunicação natural humana.

🎭 Os usuários podem definir livremente o estilo de comunicação de acordo com suas preferências, podendo até mesmo fazer a IA desempenhar um papel específico durante a conversa.

4. Geração em tempo real aprimorada do Krea, suportando geração de imagens em tempo real FLUX, combinação de colagens criativas

A inovação do Krea na área de fusão de imagens atingiu um novo nível com o lançamento de sua geração em tempo real aprimorada, que suporta a geração de imagens em tempo real FLUX. Os usuários podem carregar várias imagens, realizar recorte e conversão 3D para criar efeitos de colagem exclusivos. Este novo método de interação não apenas resolve o problema da aleatoriedade na geração de imagens de IA, mas também permite que os usuários ajustem livremente o ângulo dos elementos durante o processo de geração, aumentando significativamente a flexibilidade e a diversão da criação.

image.png

【Resumo AiBase:】

🖼️ A geração de imagens em tempo real FLUX do Krea permite que os usuários carreguem várias imagens para criar colagens criativas.

🔄 Os usuários podem girar livremente os elementos 3D gerados para encontrar o melhor ângulo de exibição.

✨ Este recurso permite que os usuários gerem primeiro imagens de estilo fantástico e, em seguida, realizem recorte e colagem para criar efeitos de filme.

Link para detalhes: https://www.krea.ai/

5. OpenAI lançará o o3-mini em algumas semanas, com desempenho ligeiramente inferior ao o1-pro

O CEO da OpenAI, Sam Altman, anunciou recentemente que o aguardado o3-mini será lançado em algumas semanas. Esta versão destilada do grande modelo será lançada em três versões: alta, média e baixa, para atender às diferentes necessidades dos usuários. Embora o desempenho seja ligeiramente inferior ao do o1-pro anterior, o o3-mini apresenta melhorias de velocidade, sendo particularmente adequado para programação. Além disso, a potência de cálculo de 872 megawatts necessária para a realização da AGI gerou debates sobre o futuro da inteligência artificial.

【Resumo AiBase:】

🌟 O o3-mini será lançado oficialmente em algumas semanas, oferecendo três versões: alta, média e baixa.

⚡️ Apesar de seu desempenho ser inferior ao do o1-pro, o o3-mini apresenta melhorias de velocidade, tornando-o mais adequado para programação.

🔋 A realização da AGI requer 872 megawatts de potência de cálculo, gerando uma ampla discussão sobre o desenvolvimento futuro da inteligência artificial.

6. Jieyue Xingchen lança os modelos de linguagem Step-2mini e Step-2 Mestre da Literatura

Em 20 de janeiro de 2025, a Shanghai Jieyue Xingchen Intelligent Technology Co., Ltd. lançou os novos membros da série de modelos de linguagem Step, o Step-2mini e o Step-2 Mestre da Literatura, com o objetivo de atender às necessidades dos desenvolvedores em diferentes cenários de criação. O Step-2mini, com seu design leve, alcança alto desempenho e resposta rápida, enquanto o Step-2 Mestre da Literatura se concentra na criação de conteúdo, capaz de gerar obras com lógica rigorosa e estilo único.

【Resumo AiBase:】

⚡️ O Step-2mini é um modelo leve que mantém mais de 80% do desempenho do Step-2, ao mesmo tempo em que melhora significativamente a velocidade de geração e a relação custo-benefício.

🖊️ O Step-2 Mestre da Literatura se concentra na criação de conteúdo, capaz de gerar obras com lógica rigorosa e ricas em ideias, demonstrando excepcional capacidade criativa.

🌐 Os desenvolvedores podem acessar a API do Step-2mini por meio da plataforma aberta da Jieyue Xingchen, fornecendo serviços eficientes de processamento de linguagem.

Link para detalhes: https://yuewen.cn

7. Runway lança o novo gerador de imagens de IA Frames, criando representações visuais cinematográficas

A Runway lançou recentemente seu mais novo modelo de geração de imagens a partir de texto, o Frames, com o objetivo de melhorar a representação visual dos criativos. O Frames recebeu elogios generalizados dos usuários por seu sistema de prompts de alta precisão e diversos estilos predefinidos, especialmente na geração de efeitos visuais cinematográficos. O modelo não apenas suporta a geração de imagens estáticas, mas também pode ser integrado perfeitamente ao modelo de conversão de imagem para vídeo da Runway, oferecendo maior flexibilidade aos profissionais criativos.

image.png

【Resumo AiBase:】

🌟 A Runway lança o gerador de imagens de IA Frames, com o objetivo de melhorar a representação visual dos criativos.

🎨 O Frames oferece diversos estilos predefinidos, permitindo que os usuários personalizem a geração de imagens com características visuais específicas.

🔒 A empresa prioriza a segurança e a ética do conteúdo, incluindo recursos de moderação de conteúdo e marca d'água para evitar o mau uso.

8. Para aumentar a expectativa de vida humana em 10 anos, a OpenAI lança o novo modelo GPT-4b micro

A OpenAI lançou seu primeiro modelo de inteligência artificial focado em dados biológicos, o GPT-4b micro, com o objetivo de aumentar a expectativa de vida humana, visando adicionar 10 anos à vida das pessoas. Em colaboração com a Retro Biosciences, este modelo se concentra no desenvolvimento de novos medicamentos para combater o envelhecimento celular, utilizando os "fatores Yamanaka" para melhorar a eficiência da reprogramação celular. Resultados preliminares de experimentos mostram que o plano de modificação sugerido pelo modelo é significativamente eficaz.

【Resumo AiBase:】

🧪 O modelo GPT-4b micro visa aumentar a expectativa de vida humana por meio da melhoria da tecnologia de reprogramação celular.

🔬 A OpenAI colabora com a Retro Biosciences, focando no desenvolvimento de novos medicamentos para combater o envelhecimento celular, utilizando os "fatores Yamanaka".

🚀 Experimentos preliminares mostram que o plano de modificação sugerido pelo modelo apresenta uma melhoria superior a 50 vezes, demonstrando uma vantagem significativa.

9. Windsurf lança a versão Wave2: suporte a conexão à internet e contexto de armazenamento

A atualização Wave2 da equipe Windsurf trouxe várias melhorias significativas ao editor, incluindo pesquisa na web, memória automática, melhorias na execução de código e recursos de marcação de problemas. Esses novos recursos visam melhorar a eficiência e a experiência personalizada dos desenvolvedores. A pesquisa na web permite que os usuários acessem informações da internet em tempo real, enquanto a memória automática aprende com os padrões de uso do usuário para fornecer suporte mais personalizado.

image.png

【Resumo AiBase:】

🌐 Pesquisa na Web: O Cascade agora pode acessar informações da internet em tempo real, aumentando a eficiência dos desenvolvedores.

🧠 Memória automática: O Cascade pode aprender automaticamente os padrões de trabalho do usuário, fornecendo suporte mais personalizado.

💻 Melhorias na execução de código: Execução de comandos aprimorada e integração profunda com contêineres de desenvolvimento, melhorando a experiência do usuário.

10. Microsoft lança teste de recurso de pesquisa de IA do Windows, melhorando a experiência de busca de arquivos

A Microsoft lançou recentemente um recurso de pesquisa do Windows impulsionado por IA no mais recente canal de desenvolvimento de versão para testadores do Windows 11 Insider. Este recurso visa ajudar os usuários a pesquisar arquivos locais usando linguagem mais natural por meio da tecnologia de indexação semântica. Os usuários precisam ter um PC C o p i l o t Plus para usar este recurso, que suporta vários formatos de arquivo e será expandido para dados em nuvem no futuro.

image.png

【Resumo AiBase:】

🌟 A Microsoft está testando um novo recurso de pesquisa de IA para o Windows 11, permitindo que os usuários encontrem arquivos locais usando linguagem mais natural.

💻 Atualmente, o recurso está disponível apenas para PCs C o p i l o t Plus, suporta vários formatos de arquivo e não requer conexão com a internet.

📈 No futuro, será expandido para dados em nuvem e para mais tipos de computadores C o p i l o t Plus.

11. Mango Super Media lança a plataforma AI Agent “Mango Simeilu”, com 70 agentes inteligentes já criados

A Mango Super Media anunciou recentemente em sua plataforma de interação com investidores o lançamento de sua nova plataforma AI Agent “Mango Simeilu”, expandindo ainda mais sua presença no campo da inteligência artificial. O lançamento desta plataforma visa melhorar a eficiência da criação e revisão de conteúdo, marcando o investimento e a inovação contínuos da empresa em tecnologia de IA. Por meio do “Mango Simeilu”, a Mango Super Media já criou mais de 70 agentes inteligentes.

【Resumo AiBase:】

🎨 Mais de 70 agentes inteligentes já foram criados na plataforma “Mango Simeilu”, abrangendo vários cenários de negócios.

⚙️ A plataforma visa melhorar a eficiência da criação e revisão de conteúdo, otimizando os fluxos de trabalho internos.

🌟 Os usuários desfrutarão de uma experiência de serviço mais eficiente e personalizada.

12. Vulnerabilidade de segurança na API do ChatGPT pode ser usada para ataques DDoS

Recentemente, o pesquisador de segurança alemão Benjamin Fleischer publicou um relatório no GitHub da Microsoft, revelando uma grave vulnerabilidade de segurança na API do ChatGPT da OpenAI, que pode ser explorada por atacantes para lançar ataques DDoS. Essa vulnerabilidade permite que os atacantes enviem um grande número de solicitações para um site específico por meio de uma simples solicitação HTTP, o que pode levar à paralisação do site alvo.

【Resumo AiBase:】

🚨 Foi descoberta uma vulnerabilidade de segurança na API do ChatGPT da OpenAI, que pode ser usada para lançar ataques DDoS.

📈 Os atacantes podem enviar milhares de links para o mesmo site com uma única solicitação, causando uma sobrecarga no site alvo.

❗ A vulnerabilidade já foi relatada à OpenAI e à Microsoft, mas não houve resposta, demonstrando negligência na gestão de segurança.

13. Geração de pôsteres de IA aprimorada! O WHEE da Meitu resolve o problema de composição de texto

A ferramenta de imagem WHEE, lançada pela Meitu, realizou uma grande atualização na geração de pôsteres, especialmente na composição de texto, permitindo que os usuários ajustem livremente o layout e o estilo do texto. Além disso, o WHEE possui modelos abrangentes e suporta a geração de materiais de decalque com um clique, aumentando significativamente a eficiência e a conveniência na criação de pôsteres.