Bem-vindo à seção 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, com foco em desenvolvedores, ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA clique para saber mais: https://top.aibase.com/
1、A Luma lança vídeo oficial apresentando os recursos do modelo Dream Machine
Após assistir ao vídeo oficial da Luma apresentando o modelo Dream Machine, fiquei impressionado com a potência desta ferramenta de geração de vídeo com IA. Ela não apenas oferece saída de vídeo de alta qualidade, mas também consegue entender rapidamente as instruções do usuário, gerando conteúdo de vídeo que se alinha a estilos estéticos. Isso é muito útil para o processo de iteração criativa, tornando a geração de vídeo muito mais eficiente.
【Resumo AiBase:】
🌟 Alta qualidade de vídeo gerado, com resolução de até 1024 pixels.
🎨 Capacidade de entender instruções e gerar vídeos com estilos estéticos.
⚡ Velocidade de inferência rápida, ideal para iteração criativa rápida.
Link para detalhes: https://top.aibase.com/tool/dream-machine
2、Novo projeto de vídeo de sincronização labial Hallo lançado, permite controle preciso de expressões e movimentos labiais
O novo projeto de vídeo de sincronização labial Hallo foi lançado. Ele gera vídeos de canto e fala a partir de uma única imagem e entrada de áudio, permitindo o controle preciso das expressões faciais e da postura do personagem, melhorando a precisão do alinhamento entre a entrada de voz e a animação gerada. Essa tecnologia pode ser usada não apenas para gerar animações de personagens virtuais, mas também para personagens reais, suportando vários controles de movimento, aplicações entre atores e geração de animações de canto. A tecnologia é avançada, a animação é realista e possui um amplo potencial de aplicação.
【Resumo AiBase:】
⭐️ Gera vídeos de canto e fala a partir de uma única imagem e entrada de áudio.
⭐️ Suporta geração de animação para personagens virtuais e reais, o projeto é de código aberto.
⭐️ Vários controles de movimento, permitindo controle preciso de expressões e postura, aumentando a diversidade e o realismo da animação.
Endereço do projeto: https://top.aibase.com/tool/hallo
3、Pequim e Kuaishou lançam em conjunto a estrutura de geração de vídeo VideoTetris, superando o Pika em efeitos de geração de vídeo complexos
Este artigo apresenta a colaboração entre a Universidade de Pequim e a equipe de IA da Kuaishou para resolver problemas complexos de geração de vídeo, apresentando a estrutura VideoTetris, que supera com sucesso os modelos comerciais Pika e Gen-2. A estrutura define tarefas de geração de vídeo combinadas, suporta instruções complexas e geração de vídeos longos, preservando informações de localização e recursos detalhados. A equipe usa um método de difusão combinada espaço-temporal, otimiza o pré-processamento de dados de treinamento e introduz um mecanismo de atenção de quadro de referência, gerando vídeos mais dinâmicos e naturais.
【Resumo AiBase:】
⭐ A estrutura VideoTetris resolve com sucesso problemas complexos de geração de vídeo, superando os modelos comerciais Pika e Gen-2.
⭐ Define tarefas de geração de vídeo combinadas, suporta instruções complexas e geração de vídeos longos, preservando informações de localização e recursos detalhados.
⭐ Usa um método de difusão combinada espaço-temporal, otimiza o pré-processamento de dados de treinamento e introduz um mecanismo de atenção de quadro de referência, gerando vídeos mais dinâmicos e naturais.
Link para detalhes: https://top.aibase.com/tool/videotetris
4、Artista de IA japonês usa Luma para reviver sua esposa, emocionando internautas
Este artigo conta a história de como o artista de IA de 65 anos, Matsuo Kimiya, usou a tecnologia para reviver sua falecida esposa, Tori-chan, que faleceu há 11 anos, comovendo inúmeras pessoas. Usando a tecnologia de IA, ele recriou e gravou as músicas de sua esposa, criou vídeos dinâmicos e extraiu e traduziu suas cartas, expressando sua saudade e amor por ela. Esta é uma história de um indivíduo comum usando a tecnologia para realizar um sonho, mostrando o poder e a temperatura do amor na era da IA.
【Resumo AiBase:】
🌟 Matsuo Kimiya usou o Dream Machine de IA da Luma para reviver sua falecida esposa, Tori-chan, comovendo muitas pessoas.
🎶 Ele usou a tecnologia de IA para recriar e gravar as músicas de sua esposa e criar vídeos dinâmicos, mostrando sua profunda saudade.
💖 Usando ferramentas de IA para extrair e traduzir cartas que sua esposa escreveu para ele, expressando seu amor e saudade eterna por ela.
Acesso ao produto: https://top.aibase.com/tool/luma-ai
Artigo detalhado: https://www.chinaz.com/ainews/9623.shtml
5、A Apple pode atrasar o lançamento de sua IA, desenvolvedores só poderão testar no final do verão
De acordo com a Bloomberg, o plano de inteligência artificial (IA) da Apple será um processo longo e lento. O plano Apple Intelligence anunciado pela Apple na semana passada deve estar disponível para testes de desenvolvedores no final do verão. Isso significa que não será um dos primeiros betas do novo sistema operacional da Apple e que apenas uma versão de visualização será lançada no outono deste ano.
【Resumo AiBase:】
🍏 O plano de inteligência artificial (IA) da Apple estará disponível para testes de desenvolvedores no final do verão.
📉 O plano da Apple não será um dos primeiros betas do novo sistema operacional.
💬 O plano Apple Intelligence mudará a forma como os consumidores interagem com seus dispositivos e compram.
6、A KREA AI lança recurso de aprimoramento de vídeo, melhorando a qualidade de vídeo com um único clique
Este artigo apresenta o recurso de aprimoramento de vídeo "Enhancer" lançado pela KREA AI, que pode melhorar a qualidade de imagem e vídeo e suportar resoluções e taxas de quadros mais altas. Os usuários podem simplesmente fazer upload da imagem/vídeo alvo que precisa ser aprimorado, a KREA AI fará o processamento online e, finalmente, gerará um vídeo de alta qualidade.
【Resumo AiBase:】
⭐ O recurso Enhancer está disponível para todos e pode melhorar a qualidade de imagem e vídeo.
⭐ Pode ser usado com ferramentas de vídeo de IA, após o processamento, você pode visualizar a comparação antes e depois do efeito de aprimoramento diretamente na página.
⭐ Pode gerar vídeos com até 2,5x pixels e taxas de quadros de até 120 fps.
Acesso ao produto: https://top.aibase.com/tool/krea-ai
7、Tsinghua e Pequim colaboram no lançamento do teste de benchmark de compreensão de vídeo longo: LVBench
Este artigo apresenta o projeto de teste de benchmark de compreensão de vídeo longo LVBench, uma colaboração entre Zhihu, Universidade Tsinghua e Universidade de Pequim, com o objetivo de compensar os desafios enfrentados pelos modelos de linguagem grandes multimodais no processamento de vídeos longos. O projeto inclui horas de dados de perguntas e respostas de várias categorias, abrangendo diferentes tipos de conteúdo de vídeo, com o objetivo de impulsionar avanços tecnológicos e inovação na área de vídeos longos. Muitas instituições de pesquisa já estão trabalhando no conjunto de dados LVBench, injetando nova vitalidade no campo da compreensão de vídeo e aprendizado multi-modal.
【Resumo AiBase:】
🔍 O projeto LVBench é um projeto de teste de benchmark de compreensão de vídeo longo, contendo horas de dados de perguntas e respostas de várias categorias.
💡 O conjunto de dados LVBench abrange várias tarefas, como resumo de vídeo, detecção de eventos, reconhecimento de personagens e compreensão de cena.
🚀 O lançamento do benchmark LVBench impulsionará avanços tecnológicos e inovação, injetando nova energia no desenvolvimento do campo de vídeos longos.
Link para detalhes: https://github.com/THUDM/LVBench
8、Modelo de geração de malha MeshAnything: transforma qualquer 3D em malha criada por artistas
Recentemente, os ativos 3D criados por reconstrução e geração atingiram o nível de qualidade dos ativos feitos à mão, destacando seu potencial em áreas de substituição. MeshAnything é um modelo autorregressivo para gerar malhas 3D criadas por artistas, alcançando a geração de malhas de alta qualidade por meio de VQ-VAE e transformadores de decodificador apenas condicionados à forma. O método melhora significativamente a eficiência de armazenamento, renderização e simulação, mantendo ao mesmo tempo precisão comparável a métodos anteriores.
【Resumo AiBase:】
⚙️ MeshAnything usa um modelo autorregressivo para gerar malhas 3D de alta qualidade criadas por artistas.
🔍 As malhas MeshAnything melhoram a eficiência de armazenamento, renderização e simulação, mantendo a precisão.
🌐 MeshAnything tem amplas aplicações em várias áreas, atendendo às necessidades criativas de diferentes usuários.
Link para detalhes: https://top.aibase.com/tool/meshanythingMeshAnything
9、Neurocientistas de Harvard e Google DeepMind criam um cérebro artificial em ratos virtuais
Este artigo apresenta uma pesquisa inovadora na qual pesquisadores da Universidade de Harvard e a equipe do Google DeepMind usaram a tecnologia de inteligência artificial para criar um "cérebro" artificial para ratos virtuais. Eles criaram com sucesso um modelo de rato 3D biomecânico realista e usaram o algoritmo de aprendizado por reforço profundo do DeepMind para treinar uma rede neural artificial como cérebro, alcançando efeitos de simulação superiores à realidade. Essa inovação promete trazer avanços revolucionários para os campos da neurociência e da inteligência artificial.
【Resumo AiBase:】
🧠 Ratos virtuais possuem um "cérebro" artificial e podem controlar seus movimentos com precisão em ambientes complexos.
🔬 O cérebro de rede neural artificial treinado usando o algoritmo DeepMind pode gerar várias trajetórias de movimento e forças complexas.
🤖 As perspectivas futuras são amplas, potencialmente abrindo um novo campo de "neurociência virtual" e trazendo novas estratégias para o tratamento de doenças do sistema nervoso.
10、McDonald's anuncia o fim da parceria com a IBM para pedidos de drive-thru com IA
O McDonald's anunciou o fim de sua parceria com a IBM para pedidos de drive-thru com IA, removendo a tecnologia testada em mais de 100 restaurantes até 26 de julho de 2024. Embora não esteja claro por que o McDonald's encerrou a parceria com a IBM, a empresa disse que está testando se um chatbot de atendimento de voz pode acelerar o atendimento e está confiante nos resultados dos testes. O setor de restaurantes está ansioso para introduzir tecnologia de IA para melhorar a eficiência.
【Resumo AiBase:】
🍔 O McDonald's encerrará sua parceria com a IBM para pedidos de drive-thru com IA, removendo a tecnologia testada em mais de 100 restaurantes.
🤖 O McDonald's está testando um chatbot de atendimento de voz para acelerar o atendimento.
🔮 O setor de restaurantes está ansioso para introduzir tecnologia de IA para melhorar a eficiência.
11、Pesquisa: as pessoas têm dificuldade em distinguir se estão conversando com um humano ou com o ChatGPT após cinco minutos
Os grandes modelos de linguagem (LLMs), como o modelo GPT-4 na plataforma de bate-papo ChatGPT, demonstram capacidades surpreendentes, tornando difícil distinguir se o texto gerado foi escrito por um humano. Um estudo da Universidade da Califórnia em San Diego descobriu que as pessoas têm dificuldade em distinguir se estão conversando com o GPT-4 ou com um humano, mostrando o nível de inteligência humana exibido pelas máquinas.
【Resumo AiBase:】
🔍 O modelo GPT-4 mostrou uma capacidade de conversa indistinguível de humanos na pesquisa.