Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, com foco em desenvolvedores, para ajudá-lo a entender as tendências tecnológicas e conhecer os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais:https://top.aibase.com/

1、OpenAI lança modo de voz avançado para usuários do ChatGPT Plus

A OpenAI anunciou o lançamento de um modo de voz avançado, oferecendo uma experiência de conversa mais natural e em tempo real, permitindo que os usuários interrompam e percebam as emoções da resposta. Os usuários de teste receberão um e-mail, e o plano é que todos os usuários Plus acessem o recurso no outono. Funções de vídeo e compartilhamento de tela também serão lançadas. O GPT-4o passou por testes multilínguas, protege a privacidade e um relatório de avaliação está previsto para ser publicado.

【AiBase destaca:】

🔊 O modo de voz avançado oferece uma experiência de conversa mais natural e em tempo real, permitindo que os usuários interrompam e percebam as emoções da resposta.

📧 Os usuários de teste receberão instruções por e-mail, com lançamento previsto para o outono para todos os usuários Plus.

🔗 A OpenAI planeja publicar um relatório de avaliação das capacidades, limitações e segurança do GPT-4o.

2、OpenAI libera novo modelo gpt-4o-64k-output-alpha; a API GPT-4o agora suporta até 64K de saída

A OpenAI lançou o novo modelo experimental gpt-4o-64k-output-alpha, cujo principal destaque é a capacidade de gerar uma saída de até 64K tokens de uma só vez, fornecendo conteúdo mais rico e detalhado, embora a um custo maior. Este modelo atende à necessidade de usuários por textos mais longos, suportando escrita, programação e análise de dados. O custo de geração de textos longos é de US$ 18 por milhão de tokens de saída, buscando corresponder ao custo computacional e incentivando o uso racional da ferramenta.

image.png

【AiBase destaca:】

📈 O modelo GPT-4o suporta saída de até 64K, ideal para usuários que precisam de conteúdo detalhado.

💰 A geração de textos longos tem um custo elevado, com US$ 18 por milhão de tokens de saída.

📝 O modelo impulsiona novas possibilidades nas áreas de criação e pesquisa, promovendo uma comunicação e criação mais profundas.

3、Versão 6.1 do Midjourney lançada: rostos em perspectiva aprimorados, detalhes mais ricos

A Midjourney lançou oficialmente a versão V6.1, trazendo atualizações mais inteligentes, rápidas, nítidas, ricas em detalhes e esteticamente aprimoradas. Esta atualização supera a coerência de imagem, melhora significativamente a qualidade da imagem, processa detalhes microscópicos com precisão, otimiza o desempenho e a velocidade, aumenta a precisão do texto, atualiza o modelo personalizado e adiciona o modo --q2, melhorando a estética geral.

image.png

【AiBase destaca:】

✨ Avanço na coerência de imagem: processamento de estruturas complexas de forma mais natural e fluida, aumentando a confiança na criação.

🌟 Melhora geral na qualidade da imagem: redução de artefatos de pixel, aumento da expressividade da textura, oferecendo um espaço mais amplo para a expressão de estilos.

🔍 Controle preciso de detalhes microscópicos: processamento surpreendente de pequenos recursos de imagem, aumentando o realismo e a expressividade da obra.

Link para detalhes:https://top.aibase.com/tool/midjourneywangyeban

4、Atualização completa do “Xiao Ai” de grande modelo da Xiaomi: suporte para edição de imagens com IA e outras funções

A Xiaomi anunciou que a nova versão do Xiao Ai com grande modelo está prestes a receber uma atualização completa, abrangendo smartphones, tablets, smart TVs, caixas de som inteligentes e veículos. A atualização traz recursos inovadores, como edição de imagens com IA e defesa contra ativação externa do veículo. As atualizações de recursos em cada linha de produtos melhorarão a experiência e a utilidade para o usuário.

image.png

【AiBase destaca:】

🚀 Atualização completa do Xiao Ai, abrangendo várias linhas de produtos e trazendo recursos inovadores.

💡 Smartphones focam na edição de imagens com IA, perguntas e respostas de documentos e criação inteligente de vídeos.

📺 Smart TVs oferecem perguntas e respostas sobre filmes, orientação para exercícios e lazer e planejamento familiar.

5、Lançamento da versão beta do PaddleX 3.0 para Ascend da Baidu

O PaddleX 3.0-beta para Ascend é uma ferramenta de desenvolvimento de baixo código e colaboração entre nuvem e dispositivo lançada pela Baidu, com o objetivo de ajudar os desenvolvedores a resolver problemas reais da indústria de forma econômica e sem barreiras. Esta versão foca em sete cenários principais de IA, oferecendo uma ampla seleção de modelos e uma forma de desenvolvimento de baixo código, com adaptação profunda ao chip Huawei Ascend 910, fornecendo aos usuários um paradigma de desenvolvimento conveniente.

image.png

【AiBase destaca:】

🚀 Ampla seleção de modelos, cobrindo vários cenários de tarefas, incluindo classificação de imagens, detecção de objetos e análise de layout de texto e imagem.

⚙️ Método de desenvolvimento de baixo código, interface de API unificada para desenvolvimento de fluxo de trabalho completo, permitindo que os usuários personalizem a conexão de fluxos de trabalho de modelos.

💻 Adaptação profunda ao chip Huawei Ascend 910, atendendo às diversas necessidades dos usuários.

Link para detalhes:https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta

6、Modelo de troca de roupa virtual com IA CatVTON: poucos parâmetros (apenas 899,06M) e suporte para alta resolução

O CatVTON é um modelo de troca de roupa virtual com IA leve, ideal para entusiastas de moda, com uma rede leve e baixa necessidade de memória, suportando operações de alta resolução. O código e o processo de implantação recém-lançados permitem que os usuários experimentem facilmente a tecnologia de maquiagem virtual em casa, com suporte para implantação em aplicativos ComfyUI e Gradio, facilitando a operação.

image.png

【AiBase destaca:】

🐈 Rede leve, com 899,06M de parâmetros totais, 49,57M de parâmetros de treinamento e necessidade de memória inferior a 8G durante a inferência, ideal para computadores pessoais.

💻 Suporte para implantação rápida no ComfyUI, permitindo experimentar a tecnologia de maquiagem virtual em poucas etapas.

👗 Pode ser usado para inferência nos conjuntos de dados VITON-HD e DressCode, suportando várias opções de precisão para se adaptar a diferentes condições de hardware.

Link para detalhes:https://top.aibase.com/tool/catvton

7、Ferramenta de mudança de penteado com IA Stable-Hair: permite a transferência de penteados

O Stable-Hair é uma tecnologia inovadora de transferência de cabelo que resolve o problema de métodos tradicionais não conseguirem lidar com penteados complexos, oferecendo aos usuários uma nova experiência de teste de penteado. Após extensa verificação experimental, o Stable-Hair alcança um nível de excelência no setor em termos de efeito de transferência de penteado, melhorando a experiência do usuário.

image.png

【AiBase destaca:】

🌟 O Stable-Hair resolve o problema de métodos tradicionais não conseguirem lidar com penteados complexos.

👨‍🔬 Emprega um processo de duas etapas, primeiro removendo o cabelo e depois transferindo o penteado.

🏆 O Stable-Hair apresentou um desempenho excepcional nos experimentos, alcançando um nível de excelência no setor.

Link para detalhes:https://github.com/Xiaojiu-z/Stable-Hair

8、Fãs se tornam guerreiros do amor puro! Usando IA para abraçar Xiangliu, explodindo as plataformas de mídia social

Este artigo discute o uso da tecnologia de inteligência artificial na expressão de emoções virtuais, usando como exemplo o personagem Xiangliu da série de sucesso “Chang Xiang Si 2”. Os fãs interagem com o personagem por meio de vídeos gerados por IA, mostrando uma forma nova e única de expressar suas emoções. No entanto, o artigo também alerta para os riscos de imersão excessiva no mundo virtual, lembrando a importância de manter o equilíbrio emocional na vida real.

image.png

【AiBase destaca:】

🤖 A tecnologia de IA ajuda os fãs a expressar suas emoções por meio de interações virtuais; a forma inovadora de geração de vídeo gera entusiasmo.

💑 Fotos de casais com IA estão se tornando populares nas plataformas de mídia social, permitindo que os fãs realizem o sonho de um contato íntimo com seus ídolos.

🧠 A tecnologia de IA está profundamente impactando o setor de entretenimento, oferecendo uma maneira nova de lidar com o apego emocional a personagens fictícios.

9、Meta encerra projeto de chatbot de celebridades, focando na ferramenta de criação de IA AI Studio

A Meta anunciou recentemente o encerramento de seu projeto de chatbot de celebridades, mudando o foco para o AI Studio, uma nova ferramenta que permite que os criadores façam seus próprios chatbots. Apesar de investimentos significativos, o projeto de chatbot de celebridades não atingiu as expectativas, mas a Meta ainda mantém esperanças em chatbots de IA. O CEO Mark Zuckerberg enfatizou a importância dos chatbots de IA, continuando a promover o assistente Meta AI em várias plataformas.

image.png

【AiBase destaca:】

🔥 A Meta encerra o projeto de chatbot de celebridades, focando na ferramenta de criação de IA AI Studio.

💰 A empresa pagou altas somas por retratos de celebridades, mas o projeto não atingiu as expectativas.

🤖 O CEO Mark Zuckerberg destaca a importância dos chatbots de IA, continuando a promover o assistente Meta AI em várias plataformas.

10、A influenciadora do TikTok “Marcona” cria outra obra-prima! A continuação de “Fairy Tale Town” com letras abstratas geradas por IA recebe 730 mil curtidas

Recentemente, uma versão de “Fairy Tale Town” com letras reescritas e cantadas por IA no TikTok causou sensação, recebendo mais de 730 mil curtidas e se tornando um tópico de discussão na internet. As letras da versão com IA são cheias de imagens abstratas, a interpretação é excelente e a música leva à reflexão. A criação com IA leva as pessoas a refletir sobre o pensamento abstrato e a lógica criativa. Também reflete a preferência da cultura online por conteúdo novo e interessante, e a criação com IA deve ser vista de forma racional. A versão com IA de “Fairy Tale Town” mostra o potencial da IA na área criativa e aumenta o interesse do público pela arte gerada por IA.

image.png

【AiBase destaca:】

⚡ A versão de “Fairy Tale Town” com letras reescritas por IA causou sensação no TikTok, recebendo mais de 730 mil curtidas, mostrando o potencial da IA na criação musical.

🎭 As letras da versão com IA são cheias de imagens abstratas, a interpretação é excelente e a música leva à reflexão sobre a criatividade da IA.

🌐 A cultura online contemporânea prefere conteúdo novo e interessante; a criação com IA deve ser vista de forma racional, explorando a essência e os limites da criatividade da IA.

11、Zhou Hongyi anuncia que o grande modelo de segurança 360 será gratuito

Zhou Hongyi anunciou que o grupo 360 disponibilizará gratuitamente o grande modelo de segurança 360, com o objetivo de popularizar a tecnologia de grandes modelos, impulsionar o progresso tecnológico e a transformação da produtividade no setor de segurança, permitindo que mais empresas e indivíduos possam arcar com o custo e usar efetivamente a tecnologia de grandes modelos.

【AiBase destaca:】

🔑 O grupo 360 disponibiliza gratuitamente o grande modelo de segurança 360, com o objetivo de popularizar a tecnologia de grandes modelos e impulsionar o progresso tecnológico no setor de segurança.

💡 Os usuários que adquirirem produtos 360 padrão receberão gratuitamente os recursos padrão do grande modelo, aprimorando os recursos do produto.

🚀 O grupo 360 desenvolveu com sucesso um grande modelo universal autodesenvolvido com bilhões de parâmetros — 360 Zhi Nao —, demonstrando sua influência e poder tecnológico no mercado.

12、Lei Jun afirma que, se não tivesse entrado no setor automobilístico, provavelmente estaria trabalhando com IA: cursou várias disciplinas de IA há mais de 30 anos

Em uma entrevista recente, Lei Jun revelou que, se a Xiaomi não tivesse entrado no setor automobilístico, a empresa provavelmente teria se concentrado mais no campo da inteligência artificial. Apesar do investimento no projeto automobilístico, a Xiaomi não ficou para trás no campo da inteligência artificial, tendo investido totalmente neste setor desde 2016. O próprio Lei Jun tem um profundo entendimento de IA, e embora tenha se concentrado principalmente em projetos automobilísticos nos últimos dois anos, ele ainda está ativamente envolvido em trabalhos relacionados à IA.

【AiBase destaca:】

🚗 A Xiaomi provavelmente se concentraria mais no campo da inteligência artificial se não tivesse entrado no setor automobilístico.

💡 A Xiaomi não ficou para trás no campo da inteligência artificial, tendo investido totalmente neste setor desde 2016.