Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais destaques do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.
Novos produtos de IA Clique para saber mais: https://top.aibase.com/
1、A SenseTime lança o grande modelo de geração de vídeo Vimi e o aplicativo para clientes Vimi Camera em teste beta aberto
A SenseTime lançou o grande modelo de geração de vídeo Vimi na Conferência Mundial de Inteligência Artificial de 2024 (WAIC), oferecendo aos usuários controle preciso de expressões e movimentos corporais, suporte a vários modos de direção, estabilidade excepcional e capacidade de gerar conteúdo de vídeo de alta consistência. A Vimi Camera, como seu primeiro aplicativo para clientes, atende às necessidades de criação e entretenimento de um grande número de usuárias, oferecendo uma variedade de estilos de geração e criação personalizada.
【Resumo AiBase:】
👩💻 O modelo Vimi utiliza a tecnologia avançada de grandes modelos da SenseTime para gerar vídeos de personagens consistentes com os movimentos-alvo, com tecnologia de rastreamento facial acumulada ao longo de anos e capacidade de controle preciso.
🎥 O Vimi pode gerar vídeos de personagens de um único plano com mais de 1 minuto de duração, sem deterioração da qualidade da imagem com o tempo, e suporta ajustes de cenário e simulação de efeitos visuais realistas.
📸 A Vimi Camera permite que os usuários carreguem imagens de alta definição de pessoas para gerar avatares digitais e vídeos de fotos, oferecendo uma variedade de estilos de geração e emojis de personagens interessantes.
2、Grátis por tempo limitado! O miniaplicativo Tencent Zhiying lança a função "Vídeo de IA"
O miniaplicativo Zhiying lançou um novo recurso chamado "Vídeo de IA", permitindo que os usuários convertam vídeos comuns em vídeos estilizados com um único clique, especialmente em estilo anime, aumentando o apelo dos vídeos. Este recurso é gratuito por tempo limitado, com o objetivo de ajudar os usuários a melhorar a estética e a diversão de seus vídeos.
【Resumo AiBase:】
🎥 Operação com um clique: fácil de usar, mesmo iniciantes podem criar vídeos estilizados de nível profissional.
🎨 Vários modelos de estilo: oferece modelos diversificados para melhorar a estética e a narrativa dos vídeos.
🚀 Aumente o poder de difusão de vídeo: vídeos estilizados são fáceis de compartilhar e atraem mais atenção do público.
3、UltraPixel: Ferramenta de geração de imagens de altíssima resolução
UltraPixel é uma tecnologia de ponta que gera imagens de altíssima resolução, uma bênção para designers e criadores. Através do treinamento e ajuste fino em cascata estável, ele suporta a geração direta de imagens com resolução de 1K a 6K. Suas técnicas incluem representação neural implícita e camadas de normalização sensíveis à escala, mantendo um alto nível de detalhe e realismo. Ao mesmo tempo, ele processa de forma eficiente no menor espaço, com uma taxa de utilização de parâmetros de até 97%, melhorando a eficiência de treinamento e inferência.
【Resumo AiBase:】
🔍 UltraPixel suporta a geração direta de imagens com resolução de 1K a 6K, com detalhes tão finos quanto os poros da pele, nítidos e precisos.
🚀 Baseado em treinamento e ajuste fino em cascata estável, em breve será de código aberto, permitindo que mais pessoas experimentem o fascínio desta tecnologia.
💡 Guiando a geração de imagens de alta resolução com informações semânticas ricas de imagens de baixa resolução, reduzindo a complexidade e mantendo um alto nível de detalhe e realismo.
Link de detalhes: https://top.aibase.com/tool/ultrapixel
4、A Groq lança um motor LLM incrivelmente rápido, atraindo 280.000 desenvolvedores em apenas quatro meses
A Groq lançou recentemente um motor LLM incrivelmente rápido que chamou a atenção de todos. Este motor processa 1256,54 tokens por segundo, muito mais rápido que as GPUs, demonstrando a velocidade e a flexibilidade dos chatbots LLM. A Groq oferece serviços gratuitos de carga de trabalho LLM, com mais de 280.000 desenvolvedores já utilizando o serviço. O CEO Ross prevê que até o próximo ano, metade dos cálculos de inferência globais serão executados nos chips da Groq.
【Resumo AiBase:】
🚀 O motor LLM da Groq processa 1256,54 tokens por segundo, muito mais rápido que as GPUs.
🤖 O motor da Groq demonstra a velocidade e a flexibilidade dos chatbots LLM, atraindo a atenção de desenvolvedores e não desenvolvedores.
💻 A Groq oferece serviços gratuitos de carga de trabalho LLM, com mais de 280.000 desenvolvedores já utilizando o serviço, e prevê que metade dos cálculos de inferência globais serão executados em seus chips.
5、Equipe de veículos autônomos lança efeitos visuais de IA de nível cinematográfico Odyssey
Uma equipe de veículos autônomos está se aventurando em Hollywood, lançando o Odyssey, um revolucionário efeito visual de IA de nível cinematográfico que está mudando a forma como filmes, programas de televisão e videogames são produzidos. O Odyssey pode gerar cenas de nível hollywoodiano, superando os obstáculos da IA de vídeo e permitindo o controle total da camada central da narrativa visual. Inspirado pela Pixar, o objetivo é usar IA para produzir obras cinematográficas e resolver o problema da controlabilidade da IA.
【Resumo AiBase:】
🎬 O Odyssey permite o controle total da camada central da narrativa visual, gerando elementos e aspectos de cena de alta qualidade.
🌟 Apresenta um modelo de geração mais poderoso, treinando quatro modelos para alcançar uma configuração detalhada dos detalhes da cena.
🚗 A equipe está intimamente relacionada com carros autônomos, e o fundador possui vasta experiência na área de direção autônoma.
Link de detalhes: https://top.aibase.com/tool/odyssey
6、Relatório indica que o fórum interno da OpenAI foi invadido por hackers, com informações confidenciais roubadas
Recentemente, o fórum interno da renomada empresa de inteligência artificial OpenAI foi atacado por hackers, causando preocupações com a segurança, e os funcionários estão preocupados com a possibilidade de exploração de vulnerabilidades de segurança. A empresa lançou uma atualização para criptografar os registros de bate-papo para melhorar a segurança dos dados e estabeleceu um comitê de segurança e proteção para fortalecer as medidas de segurança. A cooperação global para lidar com os desafios apresentados pela IA tornou-se extremamente importante.
【Resumo AiBase:】
💡 O fórum interno da OpenAI foi atacado por hackers, levantando dúvidas sobre a segurança da empresa, e os funcionários estão preocupados com a possibilidade de exploração de vulnerabilidades de segurança.
💡 Uma vulnerabilidade de segurança foi descoberta no aplicativo ChatGPT para macOS, e a empresa lançou uma atualização para criptografar os registros de bate-papo para melhorar a segurança dos dados.
💡 A OpenAI conseguiu impedir várias ações de influência secretas vindas da Rússia e de Israel, e estabeleceu um comitê de segurança e proteção para fortalecer as medidas de segurança.
7、Meta AI desenvolve o modelo de linguagem compacta MobileLLM para dispositivos móveis
A equipe de pesquisa da Meta AI lançou o MobileLLM, uma nova abordagem para modelos de linguagem eficientes projetados para smartphones e outros dispositivos com recursos limitados. Esta pesquisa desafia as suposições sobre o tamanho dos modelos de IA eficazes, alcançando uma melhoria de desempenho de 2,7% a 4,3%. O desenvolvimento do MobileLLM atende à demanda por modelos de IA mais eficientes e ainda não foi lançado ao público, mas o código de pré-treinamento foi disponibilizado como código aberto.
【Resumo AiBase:】
🔑 MobileLLM é um modelo de linguagem eficiente projetado para dispositivos com recursos limitados, desafiando a necessidade de modelos grandes.
🚀 As inovações do MobileLLM incluem priorizar a profundidade do modelo, utilizar compartilhamento de embeddings e atenção de consulta em grupo e adotar a técnica de compartilhamento de pesos de bloco direto.
💡 O MobileLLM apresenta um desempenho excelente em tarefas de teste de referência, com a versão de 350 milhões de parâmetros sendo comparável a modelos de 7 bilhões de parâmetros em algumas tarefas.
8、Plataforma social Poe lança recurso Previews
A plataforma social Poe lançou um recurso inovador chamado Previews, oferecendo aos usuários uma experiência de interação sem precedentes e marcando uma nova era para a interação social com IA. O recurso Previews é intuitivo e fácil de usar, permitindo que os usuários visualizem e interajam em tempo real com aplicativos da Web gerados por IA na interface de bate-papo, melhorando a qualidade da interação entre usuários e IA.
【Resumo AiBase:】
🚀 Uma nova era para a interação social com IA, o recurso Previews permite que os usuários operem intuitivamente aplicativos da Web gerados por IA.
💡 O recurso Previews é fácil e intuitivo de usar, permitindo que os usuários interajam com a IA de forma fácil e natural.
💻 Adequado para grandes modelos de linguagem, oferecendo aos usuários comuns a oportunidade de entrar em contato com aplicativos de programação de IA avançados e aumentando o apelo da plataforma Poe.
9、Xinsir lança modelo de código aberto Controlnet++, com suporte a mais de dez tipos de controle condicional, incluindo Openpose e Canny
O modelo de código aberto Controlnet++ recentemente lançado pela Xinsir possui várias condições de controle, podendo gerar imagens de alta qualidade, especialmente adequado para designers que precisam de edição precisa. O modelo é baseado na arquitetura ControlNet e adiciona um novo módulo que suporta mais de dez tipos diferentes de controle, fornecendo exemplos de geração de imagens sob várias condições de controle. Embora atualmente não possa ser usado no Web UI e Comfyui, sua multifuncionalidade e saída de alta qualidade o tornam um avanço significativo no campo da geração de imagens a partir de texto.
【Resumo AiBase:】
🔧 Controlnet++ suporta entradas como Openpose e Canny, evitando a necessidade de trocar de modelo com frequência.
🧩 O modelo é projetado com várias características de controle, usando os mesmos parâmetros de rede para alcançar a geração de imagens sob diferentes condições.
🚀 Controlnet++ apresenta um desempenho excelente em experimentos SDXL, fornecendo exemplos de geração de imagens sob várias condições de controle.
Link de detalhes: https://top.aibase.com/tool/controlnet-
10、Modelo de IA médica do Alipay faz sua aparição, superando o GPT-4 em exames de chinês e inglês
O modelo de IA médica do Alipay superou o GPT-4 em exames de chinês e inglês e já foi implantado em hospitais de primeira linha em Jiangsu, Zhejiang e Xangai. O modelo possui capacidades multimodais, com uma taxa de precisão superior a 90%, podendo fornecer serviços como perguntas e respostas inteligentes, estruturação e recuperação de prontuários médicos. O Alipay, em conjunto com várias instituições, lançou um plano de construção conjunta de IA médica, dedicado a melhorar a eficiência médica e a segurança dos dados.
【Resumo AiBase:】
🏥 O modelo de IA médica do Alipay superou o GPT-4 em exames de chinês e inglês e já foi implantado em hospitais de primeira linha.
💡 O modelo possui capacidades multimodais, com uma taxa de precisão superior a 90%, podendo fornecer serviços como perguntas e respostas inteligentes, estruturação e recuperação de prontuários médicos.
🔒 O Alipay adota várias medidas para garantir a confiabilidade tecnológica e a segurança da privacidade dos dados, impulsionando a implantação em larga escala da inteligência artificial.