Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Saiba mais: https://top.aibase.com/

1. OpenAI anuncia atualização de pesquisa do ChatGPT com suporte a mapas, voz avançada e outros recursos

Em sua mais recente transmissão ao vivo, a OpenAI anunciou uma grande atualização técnica para a plataforma ChatGPT, lançando um modo de pesquisa em tempo real e interação de voz avançada, melhorando significativamente a experiência do usuário. Com o algoritmo de pesquisa otimizado, os usuários podem obter informações em tempo real rapidamente e visualizar diretamente os links de origem, aumentando a conveniência das informações. Além disso, os novos recursos de reprodução de vídeo e integração de mapas oferecem aos usuários uma experiência de pesquisa mais intuitiva, melhorando a eficiência de pesquisa em dispositivos móveis.

微信截图_20241217081801.png

【Resumo AiBase:】

📈 O ChatGPT atualizado introduziu a pesquisa em tempo real, otimizando o algoritmo de pesquisa para permitir que os usuários acessem rapidamente informações em tempo real, como ações e notícias.

🗣️ O novo modo de interação de voz avançada permite que os usuários realizem pesquisas de várias rodadas por meio de voz, oferecendo uma experiência personalizada de assistente de voz.

🗺️ O ChatGPT agora oferece suporte à integração de mapas, permitindo que os usuários vejam diretamente informações de localização geográfica, planejem rotas e explorem locais.

2. Google aprimora o modelo de geração de vídeo de IA Veo2, com resolução 4K e pontuação de preferência humana superior à do Sora

O Google lançou recentemente seu modelo de geração de vídeo de nova geração, o Veo2, com o objetivo de competir com o Sora da OpenAI. O Veo2 demonstra maior realismo e detalhes na geração de vídeo, e os usuários podem solicitar acesso por meio da plataforma VideoFX do Google Labs. Além disso, o Google também atualizou o modelo de geração de imagens Imagen3, melhorando ainda mais o realismo e a representação de cores das imagens geradas.

image.png

【Resumo AiBase:】

🎥 O modelo de geração de vídeo Veo2 supera o Sora da OpenAI em qualidade, e os usuários podem solicitar acesso.

🚀 Os usuários podem escolher o estilo e os efeitos do vídeo, gerando vídeos com resolução de até 4K.

🎨 O modelo de geração de imagens Imagen3 atualizado apresenta melhor estilo artístico e experiência do usuário.

Link para mais detalhes: https://labs.google/fx/tools/video-fx

3. Midjourney lança modelos personalizados e moodboards, permitindo o treinamento de modelos com upload de imagens

Em 16 de dezembro de 2024, a Midjourney lançou o aguardado recurso "moodboard", permitindo que os usuários carreguem conjuntos de imagens de inspiração para gerar novas obras de arte. Combinado com os modelos de IA mais recentes, os usuários podem criar perfis personalizados com mais facilidade, simplificando o processo de criação de modelos e reduzindo a barreira de entrada para novos usuários. Além disso, os recursos de organização aprimorados permitem que os usuários gerenciem melhor vários projetos.

image.png

【Resumo AiBase:】

🌟 A Midjourney lança o recurso moodboard, permitindo que os usuários carreguem conjuntos de imagens de inspiração.

🚀 A criação de perfis personalizados ficou mais simples, os usuários precisam apenas de 40 avaliações para começar.

🛠️ Os recursos de organização foram aprimorados, os usuários podem nomear perfis e rastrear imagens relacionadas.

Link para mais detalhes: https://www.midjourney.com/personalize

4. Google lança a nova ferramenta de IA Whisk, sem necessidade de prompts, que pode misturar várias imagens para gerar imagens de novo estilo

A mais recente ferramenta de IA lançada pelo Google, Whisk, altera significativamente a maneira tradicional de gerar imagens, permitindo que os usuários gerem novas imagens carregando várias imagens, sem depender de descrições de texto longas. O Whisk foi projetado para exploração visual rápida, permitindo que os usuários combinem facilmente imagens de diferentes estilos e temas para criar obras visuais únicas. Embora o processo de geração de imagens possa levar alguns segundos e, às vezes, os resultados sejam um pouco estranhos, a experiência geral é muito divertida.

image.png

【Resumo AiBase:】

🎨 O Whisk permite que os usuários gerem imagens de novos estilos usando várias imagens, revolucionando o método tradicional de prompts de texto.

✨ Os usuários podem carregar imagens de diferentes temas, que são automaticamente combinadas para gerar efeitos visuais interessantes.

🚀 O Google também lançou os modelos Imagen3 e Veo2, melhorando ainda mais a capacidade de geração de imagens e vídeos.

Link para mais detalhes: https://top.aibase.com/tool/whisk

5. Novo recurso do YouTube: permite que criadores autorizem terceiros a usar vídeos para treinar IA

O YouTube lançou recentemente um novo recurso que permite aos criadores escolherem se autorizam ou não empresas terceiras a usar seus vídeos para treinar modelos de inteligência artificial. A configuração padrão é desativada, e os criadores não precisam fazer nada se não quiserem que terceiros usem seus vídeos.

【Resumo AiBase:】

🔒 A configuração padrão é desativada, os criadores precisam optar ativamente por permitir que terceiros usem seus vídeos para treinamento de IA.

🤝 As empresas terceiras permitidas incluem empresas de IA conhecidas, como OpenAI, Apple e Microsoft.

📈 Este recurso visa ajudar os criadores a alcançar um novo valor de conteúdo na era da IA.

6. TuSimple lança o modelo de geração de vídeo a partir de imagens "Ruyi" e código aberto Ruyi-Mini-7B

Em 17 de dezembro de 2024, a TuSimple (Beijing) Future Technology Co., Ltd. lançou seu primeiro grande modelo de "geração de vídeo a partir de imagens", o "Ruyi", e lançou o código aberto da versão Ruyi-Mini-7B para download pelos usuários na plataforma Hugging Face. Este modelo foi projetado para placas de vídeo de consumo e possui várias capacidades de geração, mostrando um excelente potencial de narrativa visual, especialmente nas áreas de anime e jogos. Apesar do progresso tecnológico, ainda há alguns defeitos a serem resolvidos.

微信截图_20241217140324.png

【Resumo AiBase:】

🚀 O grande modelo Ruyi foi projetado para placas de vídeo de consumo, suporta geração de vídeo em várias resoluções e durações, podendo lidar com resoluções de 384×384 a 1024×1024.

🎨 O modelo apresenta excelente desempenho em consistência entre quadros, fluidez de movimento e representação de cores, tornando-se um parceiro criativo ideal para entusiastas de anime e jogos.

🔧 Apesar do progresso tecnológico, o Ruyi ainda apresenta alguns defeitos, como deformações nas mãos e detalhes faciais distorcidos, e a TuSimple está trabalhando para melhorá-lo.

Link para mais detalhes: https://huggingface.co/IamCreateAI/Ruyi-Mini-7B

7. Zhipu.AI conclui rodada de financiamento de 3 bilhões de yuans, impulsionando o desenvolvimento e a comercialização de tecnologia de grandes modelos

A Zhipu.AI concluiu recentemente uma nova rodada de financiamento de 3 bilhões de yuans, atraindo a participação de numerosos investidores estratégicos e instituições estatais. Esses fundos serão usados ​​para o desenvolvimento e atualização do grande modelo Zhipu Base, melhorando ainda mais sua capacidade de resolver tarefas complexas de raciocínio e multimodais. Apesar dos desafios da concorrência de mercado e da desaceleração do progresso tecnológico, a Zhipu.AI mantém sua posição de liderança no setor de IA e exerce uma influência significativa em todo o mundo. 【Resumo AiBase:】

🚀 A Zhipu.AI concluiu uma rodada de financiamento de 3 bilhões de yuans, que serão usados ​​para P&D e atualização do grande modelo base, impulsionando a inovação do setor.

📈 Este ano, a Zhipu.AI obteve crescimento contrário à tendência no mercado B2B, com receita de API crescendo mais de 30 vezes ano a ano e o número de clientes pagantes crescendo 20 vezes.

🌍 O produto C2C da Zhipu.AI, "Zhipu Qingyan", atraiu mais de 25 milhões de usuários, e espera-se que os recursos pagos gerem milhões de receita.

8. Meta lança o modelo de prova de roupa de IA de código aberto Leffa: preserva mais detalhes

A Meta lançou recentemente o Leffa, uma estrutura de prova virtual de IA de código aberto, projetada para melhorar a experiência de compra de roupas dos usuários gerando novas imagens. Os usuários precisam apenas carregar uma imagem de referência, e o sistema pode gerar novos efeitos de roupas, reduzindo o incômodo de devoluções devido a tamanhos inadequados. O Leffa se destaca na preservação de detalhes e na redução de distorções de imagem, oferecendo um efeito de prova mais natural.

image.png

【Resumo AiBase:】

🌟 O Leffa é uma estrutura de prova virtual de código aberto lançada pela Meta, que pode gerar novas imagens com base em imagens de referência.

👗 Esta estrutura pode reduzir efetivamente a distorção da imagem, preservando mais detalhes e melhorando a experiência de prova virtual.

💻 Os usuários podem experimentar o Leffa na plataforma Hugging Face, e a Meta fornece o código completo do projeto.

Link para mais detalhes: https://github.com/franciszzj/Leffa

9. Diffusion-Vas: rastreamento de alvos de vídeo, pode preencher partes ocultas

Na área de análise de vídeo, a persistência de objetos é uma pista importante para entender a existência de objetos. O método Diffusion-Vas proposto pelos pesquisadores, baseado em priorização de difusão, visa melhorar o efeito de segmentação e preenchimento de conteúdo de vídeo sem modalidade. Este método é dividido em duas etapas: primeiro, um máscara sem modalidade é gerada e, em seguida, um modelo de geração condicional é usado para preencher a área oculta. Após vários testes de referência, este método apresentou excelente desempenho em cenários complexos, com uma melhoria de precisão de 13%.

image.png

【Resumo AiBase:】

🌟 Os pesquisadores propuseram um novo método que usa priorização de difusão para realizar segmentação e preenchimento de conteúdo de vídeo sem modalidade.

🖼️ O método é dividido em duas etapas: primeiro, uma máscara sem modalidade é gerada e, em seguida, o preenchimento da área oculta é realizado.

📊 Em vários testes de referência, este método melhorou significativamente a precisão da segmentação sem modalidade, apresentando desempenho excelente, especialmente em cenários complexos.

Link para mais detalhes: https://diffusion-vas.github.io/

10. Atualização dos óculos inteligentes Ray-Ban Meta da Meta: recursos de vídeo e tradução em tempo real com IA

A Meta atualizou significativamente seus óculos inteligentes Ray-Ban Meta, lançando vários novos recursos baseados em inteligência artificial, incluindo conversação em tempo real e tradução de idiomas. Esses recursos permitem que os usuários se comuniquem com assistentes de IA de forma mais natural, sem precisar ativar o assistente com frequência, e também oferecem suporte à tradução instantânea em vários idiomas, melhorando significativamente a conveniência da comunicação do usuário. Além disso, os óculos também incluem o recurso Shazam, permitindo que os usuários identifiquem músicas por meio de reconhecimento de voz.

image.png

【Resumo AiBase:】

🌟 Os óculos inteligentes Ray-Ban Meta lançam recursos de vídeo e tradução em tempo real com IA, permitindo que os usuários conversem com assistentes de IA a qualquer momento.

🌍 O novo recurso de tradução em tempo real oferece suporte à tradução instantânea entre vários idiomas, melhorando a conveniência da comunicação do usuário.

🎵 Os óculos também oferecem suporte ao recurso Shazam, permitindo que os usuários identifiquem a música que está tocando por meio de reconhecimento de voz.

11. CEO da Broadcom prevê grande explosão no mercado de IA, valor de mercado da empresa ultrapassa US$ 1 trilhão

Hock Tan, CEO da Broadcom, expressou uma perspectiva otimista sobre o mercado de chips de IA em uma recente teleconferência de resultados financeiros, prevendo um crescimento significativo na receita da empresa nessa área até 2027, com um mercado de serviço endereçável estimado entre US$ 60 bilhões e US$ 90 bilhões. O valor de mercado da empresa ultrapassou US$ 1 trilhão pela primeira vez devido ao aumento da demanda por chips de IA.

【Resumo AiBase:】

🌟 A Broadcom prevê que o mercado de serviço endereçável de IA atingirá entre US$ 60 bilhões e US$ 90 bilhões até 2027.

📈 O valor de mercado da Broadcom ultrapassou US$ 1 trilhão pela primeira vez devido ao aumento da demanda por chips de IA.

💰 Com a aquisição da VMware, a receita total da Broadcom cresceu 51% e os custos operacionais foram significativamente reduzidos.

12. Kingsoft Office: WPS AI desbloqueará gratuitamente quatro recursos de geração de PPT de IA e outros

A Kingsoft Office anunciou que o WPS AI oferecerá quatro recursos gratuitos aos usuários durante o período de fim de ano, com o objetivo de melhorar a eficiência e a criatividade no trabalho. Os usuários podem usar recursos como geração de PPT com IA, clonagem de estilo e filtros para criar rapidamente apresentações de fim de ano profissionais. Além disso, o WPS também oferece uma variedade de modelos de PPT para atender às necessidades de diferentes usuários.

image.png

【Resumo AiBase:】

🎉 O WPS AI desbloqueará gratuitamente os recursos de geração de PPT com IA, clonagem de estilo, filtros e modelos, melhorando a eficiência do trabalho dos usuários.

🖼️ O recurso de geração de PPT com IA pode gerar rapidamente apresentações profissionais, aprimorando inteligentemente o conteúdo, mantendo a lógica e a estética do design.

📋 Os usuários podem participar da atividade "Temporada de Resumos com IA" para obter modelos de apresentação de fim de ano, atendendo às necessidades de diferentes setores.