Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Saiba mais:https://top.aibase.com/

1、A versão oficial da ferramenta AIGC “Jichuang” da gigante de mecanismos de busca está disponível

A ferramenta AIGC “Jichuang” da gigante de mecanismos de busca foi oficialmente lançada, oferecendo várias maneiras de gerar conteúdo, incluindo geração de roteiros de IA, edição inteligente de vídeos e pessoas digitais. A plataforma utiliza aprendizado profundo e processamento de linguagem natural, permitindo que os usuários gerem conteúdo de texto e vídeo de alta qualidade simplesmente inserindo um tema. Os recursos recém-adicionados de disseminação viral e aprovação com um clique ajudam os criadores a responder rapidamente às mudanças de mercado, melhorando a eficiência criativa e a conformidade de conteúdo.

image.png

【Resumo AiBase:】

🌟 Jichuang suporta vários tipos de geração de conteúdo, melhorando a eficiência criativa.

📊 Novos recursos de disseminação viral e aprovação com um clique ajudam os criadores a responder rapidamente ao mercado.

🎨 A tecnologia de IA lidera a revolução na criação de conteúdo, incentivando os criadores a explorarem novas ferramentas.

Link para detalhes:https://top.aibase.com/tool/douyinjichuang

2、Tongyi Wanxiang lança modelo de vídeo 2.1, melhorando significativamente a capacidade de movimento complexo

O modelo de geração de vídeo Tongyi Wanxiang da Alibaba recebeu uma atualização significativa em sua versão mais recente 2.1, lançando versões de alta velocidade e profissional, focadas em desempenho eficiente e excelente capacidade de expressão, respectivamente. Esta versão fez progressos significativos no processamento de movimentos complexos e na reprodução de leis físicas reais, melhorando a qualidade cinematográfica do vídeo e a capacidade de seguir instruções.

image.png

【Resumo AiBase:】

🚀 A nova versão é dividida em versão de alta velocidade e versão profissional, melhorando o desempenho eficiente e a capacidade de expressão, respectivamente.

🐱 Os vídeos gerados são ricos em detalhes, resolvendo com sucesso o problema de "rabiscos", permitindo a geração precisa de texto em chinês e inglês.

🎬 Os efeitos de câmera são como os de um mestre do cinema, podendo ajustar automaticamente as lentes, melhorando a arte do vídeo.

Link para detalhes:https://tongyi.aliyun.com/wanxiang/videoCreation

3、Microsoft lança oficialmente o poderoso modelo pequeno Phi-4 de código aberto

A Microsoft lançou o modelo de linguagem pequeno Phi-4 na plataforma Hugging Face, com 14 bilhões de parâmetros. Seu desempenho é excelente, superando vários modelos conhecidos, como GPT-4o e Llama-3.1. O Phi-4 obteve 91,8 pontos na competição matemática AMC e 84,8 pontos no teste MMLU, demonstrando sua poderosa capacidade de raciocínio. Este modelo utiliza um método inovador de geração de dados sintéticos, suporta comprimento de contexto de até 16k e é adequado para hardware de consumo.

image.png

【Resumo AiBase:】

🧩 O modelo Phi-4 da Microsoft tem apenas 14 bilhões de parâmetros, mas superou vários modelos conhecidos, como GPT-4o e Llama-3.1, em testes de desempenho.

📈 O Phi-4 se destaca em matemática e capacidade de raciocínio, especialmente nos testes AMC e MMLU, obtendo pontuações altas.

🌍 Este modelo foi lançado como código aberto e suporta uso comercial, atraindo a atenção de muitos desenvolvedores e entusiastas de IA.

Link para detalhes:https://huggingface.co/microsoft/phi-4

4、Nova tecnologia de restauração de vídeo SeedVR: transforma vídeos borrados em alta definição, podendo processar vídeos de qualquer comprimento

No contexto do rápido desenvolvimento de mídia digital, a melhoria da qualidade de vídeo tornou-se um tópico importante. A tecnologia SeedVR, desenvolvida por uma equipe de pesquisa da Universidade Tecnológica de Nanyang e da ByteDance, utiliza um mecanismo inovador de atenção de janela móvel para melhorar significativamente os efeitos de restauração de vídeo, especialmente no processamento de vídeos gerados por IA. Esta tecnologia não apenas pode processar vídeos de qualquer comprimento, mas também pode reparar eficazmente os detalhes da imagem, proporcionando aos usuários uma experiência visual mais realista.

image.png

【Resumo AiBase:】

🌟 SeedVR utiliza um mecanismo de atenção de janela móvel, melhorando com sucesso a capacidade de processamento de sequências de vídeo longas.

🎥 Esta tecnologia utiliza um tamanho de janela maior, melhorando significativamente a qualidade de restauração de vídeos de alta resolução.

🚀 Combinando várias técnicas modernas, o SeedVR apresenta um desempenho excelente em vários testes de referência, especialmente para vídeos gerados por IA.

Link para detalhes:https://iceclear.github.io/projects/seedvr/

5、TransPixar da Adobe integra perfeitamente efeitos transparentes como fumaça e reflexos em cenas

O sistema TransPixar, desenvolvido em conjunto pela Adobe Research e pela Universidade de Ciência e Tecnologia de Hong Kong, revolucionou a produção de efeitos visuais, especialmente no processamento de elementos transparentes. Esta tecnologia gera efeitos visuais contendo canais alfa, melhorando significativamente a eficiência de produção e reduzindo custos. O lançamento do TransPixar ocorre em um momento de crescente demanda por efeitos especiais de alta qualidade na indústria, sinalizando uma mudança nos fluxos de trabalho de produção cinematográfica futuros.

【Resumo AiBase:】

🌟 O TransPixar, através de tecnologia de IA inovadora, pode gerar efeitos transparentes de alta qualidade com dados de treinamento limitados, simplificando o processo de produção de efeitos especiais.

💡 Este sistema não apenas melhora a eficiência do trabalho de grandes equipes de produção, mas também reduz os custos para pequenos estúdios, permitindo-lhes alcançar efeitos especiais complexos.

🚀 O TransPixar mostra um enorme potencial em aplicações em tempo real, podendo gerar rapidamente efeitos transparentes, adequados para jogos de vídeo e realidade aumentada.

6、Desenvolvido em conjunto pela ByteDance e universidades! Modelo STAR: melhora a clareza e a resolução de vídeo

A tecnologia STAR, desenvolvida em conjunto pela equipe de pesquisa da Universidade de Nanjing, ByteDance e Universidade do Sudoeste, utiliza um modelo de texto para vídeo para realizar o processamento de super-resolução de vídeo, melhorando significativamente a qualidade de vídeos de baixa resolução. Esta tecnologia, combinada com métodos de aprimoramento espaço-temporal, é adequada para vídeos de baixa definição baixados de plataformas de compartilhamento de vídeo. A equipe de pesquisa já lançou o modelo pré-treinado e o código de inferência no GitHub, com um processo de uso simples, impulsionando o progresso no campo do processamento de vídeo.

image.png

【Resumo AiBase:】

🌟 A nova tecnologia STAR combina modelos de texto para vídeo, realizando super-resolução de vídeo e melhorando a qualidade do vídeo.

🛠️ A equipe de pesquisa já lançou o modelo pré-treinado e o código de inferência, com um processo de uso simples e claro.

📩 Fornece informações de contato, incentivando os usuários a se comunicarem e discutirem com a equipe de pesquisa.

Link para detalhes:https://github.com/NJU-PCALab/STAR

7、Stability AI lança SPAR3D: geração de objetos 3D a partir de uma única imagem em um segundo

Na CES, a Stability AI lançou o SPAR3D, uma tecnologia inovadora de geração 3D em duas etapas que pode gerar objetos 3D precisos a partir de uma única imagem em menos de um segundo. O SPAR3D não apenas fornece uma maneira eficiente de projetar protótipos 3D, mas também permite que os usuários editem os objetos 3D gerados em tempo real, melhorando a flexibilidade criativa.

image.png

【Resumo AiBase:】

⚡ Capacidade de geração em tempo real: O SPAR3D pode gerar objetos 3D completos a partir de uma única imagem em um segundo e suporta edição rápida.

🔍 Previsão de estrutura precisa: fornece formas geométricas precisas e visualizações de 360 graus, incluindo áreas ocultas, garantindo saída de alta resolução.

🚀 Política de uso aberta: suporta uso comercial e não comercial, os usuários podem obter e usar o modelo de várias maneiras.

Link para detalhes:https://stability.ai/news/stable-point-aware-3d

8、238 serviços de inteligência artificial generativa concluíram o registro na Cyberspace Administration of China em 2024

O Gabinete de Informação da Internet da China publicou um anúncio em 8 de janeiro, indicando que até 31 de dezembro de 2024, 302 serviços concluíram o registro, sendo 238 novos em 2024. Isso indica um rápido desenvolvimento do setor, com mais novos serviços recebendo aprovação oficial. O anúncio também exige que as empresas que fornecem serviços com atributos de opinião pública realizem o registro e melhorem a transparência dos aplicativos já lançados, garantindo a conformidade e a segurança.

【Resumo AiBase:】

🌟 Em 2024, um total de 302 serviços de inteligência artificial generativa concluíram o registro na Cyberspace Administration of China, com 238 novos serviços.

🔍 As empresas que fornecem serviços com atributos de opinião pública podem realizar o registro através do departamento de cibersegurança local, garantindo a conformidade.

📝 Os aplicativos já lançados devem divulgar as informações dos serviços registrados usados, melhorando a transparência.

9、Ranking das 50 maiores empresas de inteligência artificial da China em 2024 da Hurun: iFLYTEK em segundo, SenseTime em terceiro

O ranking das 50 maiores empresas de inteligência artificial da China em 2024 da Hurun foi oficialmente lançado. A Cambrian, com um valor estimado de 238 bilhões de yuans, ocupa o primeiro lugar, mostrando sua força no campo da IA. A iFLYTEK e a SenseTime seguem de perto, com valores estimados de 116 bilhões e 500 bilhões de yuans, respectivamente. O ranking mostra que Pequim, Xangai e Shenzhen são os principais centros de empresas de IA, representando juntas 80% das empresas classificadas.

【Resumo AiBase:】

🌟 A Cambrian ocupa o primeiro lugar com um valor estimado de 238 bilhões de yuans, seguida pela iFLYTEK e SenseTime em segundo e terceiro lugares, respectivamente.

🏙️ Pequim, Xangai e Shenzhen tornaram-se os principais centros de empresas de inteligência artificial, representando juntas 80% das empresas classificadas.

📊 Este ranking concentra-se em empresas de inteligência não incorporada, não incluindo empresas nas áreas de robótica e casas inteligentes.

10、Você não vai acreditar! Repetir esta instrução simples faz com que a IA gere código 100 vezes mais rápido

Max Woolf, cientista de dados sênior da BuzzFeed, conduziu um experimento usando o modelo de linguagem Claude 3.5. Ao solicitar repetidamente à IA que melhorasse o código, ele conseguiu reduzir o tempo de execução de 657 milissegundos para 6 milissegundos, melhorando o desempenho em 100 vezes. No experimento, a IA demonstrou sua compreensão única de "código melhor", adicionando automaticamente características corporativas.

【Resumo AiBase:】

🌟 A IA melhorou o desempenho do código através de instruções repetidas, reduzindo o tempo de execução do código original de 657 milissegundos para 6 milissegundos.

💡 A IA adicionou automaticamente características corporativas ao código, mostrando sua compreensão única de "código melhor".

🛠️ A engenharia de prompts ainda é importante, solicitações precisas podem acelerar a geração de resultados, mas ainda requerem que os desenvolvedores humanos verifiquem e corrijam.

11、NVIDIA lança a tecnologia Groot Teleop, permitindo o treinamento de robôs através do Apple Vision Pro

A NVIDIA lançou uma série de tecnologias inovadoras na CES, com o objetivo de acelerar o desenvolvimento de robôs humanoides, especialmente nas áreas industrial e de manufatura. Através do projeto Isaac GR00T, os desenvolvedores podem usar o aprendizado por imitação para gerar uma grande quantidade de dados de movimento sintético para treinar robôs humanoides. Esta tecnologia não apenas reduz o tempo e o custo de coleta de dados, mas também gera vídeos de consciência física através da plataforma Cosmos, impulsionando o desenvolvimento da inteligência artificial física.

image.png

【Resumo AiBase:】

🚀 A NVIDIA lançou o projeto Isaac GR00T, usando aprendizado por imitação para gerar dados de movimento sintéticos, acelerando o desenvolvimento de robôs humanoides.

📊 A plataforma Cosmos, treinada com 18 trilhões de dados, gera vídeos de consciência física, promovendo o desenvolvimento da inteligência artificial física.

🤝 Várias empresas de robótica já adotaram a tecnologia Isaac GR00T, mostrando bons resultados de aplicação.

12、Invenção assustadora! Engenheiro usa ChatGPT para criar rifle robótico, OpenAI age imediatamente

Recentemente, o engenheiro STS3D criou um rifle robótico que pode ser mirado e disparado através de comandos do ChatGPT, mostrando uma velocidade de reação e precisão surpreendentes. Esta invenção gerou amplas discussões, especialmente sobre a preocupação de transformar tecnologias de ficção científica em realidade. A OpenAI respondeu rapidamente, indicando que esta ação viola as políticas da empresa e proíbe o uso de seus serviços para desenvolver armas.

【Resumo AiBase:】

🌐 A OpenAI cortou rapidamente sua relação com o engenheiro que desenvolveu o rifle robótico, pois ele violou as políticas de uso.