Bem-vindo à seção 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais assuntos do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Saiba mais: https://top.aibase.com/

1. O grande modelo de geração de vídeo Step-Video da Jieyue Xingchen inicia testes internos. Solicitações podem ser feitas através do Yuewen Video.

O modelo Step-Video da Jieyue Xingchen iniciou oficialmente seus testes internos. Os usuários podem solicitar acesso através do site oficial do Yuewen Video. O modelo suporta a geração de vídeos com resolução de até 1080P e duração máxima de 10 segundos a partir de texto, demonstrando vantagens significativas na otimização automática de prompts, estilo estético e controle de movimento.

image.png

【Resumo AiBase:】

🎬 O modelo Step-Video suporta a geração de vídeos em alta definição a partir de texto, com resolução de até 1080P e duração máxima de 10 segundos.

🌟 Em termos de estilo estético, o Step-Video demonstra uma compreensão e geração particularmente precisa de temas chineses, alinhados com a atmosfera da poesia clássica.

⚙️ O modelo apresenta excelente desempenho no controle de movimento, capaz de gerar vídeos que obedecem às leis da física e processam relações espaciais complexas.

Link para detalhes: https://top.aibase.com/tool/yuewenshipin

2. Luma lança o novo modelo de geração de imagens Luma Photon: mais rápido e mais econômico!

Os modelos de geração de imagens Luma Photon e Photon Flash, lançados pela Luma Labs, são revolucionários, oferecendo velocidade de geração excepcionalmente alta e baixo custo. O Luma Photon se destacou em vários testes, gerando imagens de alta qualidade adequadas para publicidade, cinema, artes e outros campos.

【Resumo AiBase:】

🚀 A velocidade de geração de imagens do Luma Photon é 10 vezes maior que a de outros modelos no mercado, com custo de apenas US$ 0,002 por imagem de 1080p.

🎨 Suporta instruções de linguagem natural em várias rodadas, permitindo que os usuários otimizem gradualmente o conteúdo gerado, ideal para tarefas criativas complexas.

📈 Em termos de qualidade, criatividade e compreensão, o Luma Photon superou todos os modelos do mercado em avaliações cegas.

Link para detalhes: https://lumalabs.ai/photon

3. Obras do projeto de cocriação de direção de IA da Keling AI serão lançadas em 6 de dezembro, com 9 vídeos de nível cinematográfico de IA.

A Kuaishou Technology anunciou o lançamento oficial, em 6 de dezembro, do primeiro projeto de cocriação de direção AIGC da China - o "Projeto de Cocriação de Direção de IA Keling". Este projeto foi iniciado pelo grande modelo de geração de vídeo "Keling AI", desenvolvido pela Kuaishou, em conjunto com vários diretores renomados, com o objetivo de expandir os limites da criação cinematográfica através da tecnologia de IA.

image.png

【Resumo AiBase:】

🎥 O projeto foi iniciado pela Kuaishou Technology e 9 diretores renomados, abrangendo diversos temas.

🤖 Todos os curtas-metragens serão gerados usando o Keling AI, impulsionando o uso da tecnologia de IA na criação cinematográfica.

📈 Desde seu lançamento, o Keling AI já atendeu mais de 5 milhões de usuários, gerando 51 milhões de vídeos e 150 milhões de imagens.

4. Modelo de imagem 2.1 do Jimeng AI da ByteDance em teste beta: geração de imagens de IA finalmente pode gerar fontes chinesas!

O Jimeng AI, da ByteDance, lançou recentemente o modelo de imagem 2.1, resolvendo o problema da geração de fontes chinesas em imagens de IA. Os usuários podem gerar rapidamente cartazes personalizados com uma simples entrada de texto, aumentando significativamente a eficiência de trabalho dos designers. O novo modelo possui amplas aplicações, incluindo criação de cartazes, design de capas de livros e imagens para mídias sociais.

image.png

【Resumo AiBase:】

🎨 O novo modelo suporta a geração de fontes chinesas, melhorando a eficiência do design de cartazes.

📚 Os usuários podem criar cartazes e capas personalizados através de descrições de texto.

🌌 O modelo possui amplas aplicações, adequado para mídias sociais, criação de histórias, etc.

Link para detalhes: https://top.aibase.com/tool/jimeng

5. Busca de IA da Mita AI: dados de "busca acadêmica" aumentam 7 vezes, com novo recurso de "explicação".

A Shanghai Mita Network Technology Co., Ltd. recentemente realizou uma grande atualização em seu recurso de busca acadêmica de IA Mita, aumentando a quantidade de dados em 7 vezes. Os usuários agora podem acessar mais completamente dezenas de milhões de artigos de acesso aberto, incluindo 40% dos artigos SCI e periódicos de ponta como "Nature" e "Science". Esta atualização também adicionou um recurso de "explicação", ajudando os usuários a entender conteúdos complexos de literatura.

微信截图_20241203091022.png

【Resumo AiBase:】

📈 Aumento de 7 vezes na quantidade de dados, cobrindo dezenas de milhões de artigos de acesso aberto, melhorando a capacidade de pesquisa.

📝 Novo recurso de "explicação", ajudando os usuários a entender frases complexas em literatura.

🌍 Suporta modelos de tradução em 44 idiomas, eliminando barreiras à leitura de artigos em idiomas minoritários.

6. Estreia empreendedora de Fei-Fei Li: geração de mundo 3D interativo a partir de uma imagem, AIGC entra em uma nova era!

O mais recente projeto de Fei-Fei Li, o World Labs, apresenta uma tecnologia de geração 3D revolucionária. Os usuários podem criar cenários 3D interativos fornecendo apenas uma imagem ou uma frase, marcando a entrada do AIGC em uma nova era imersiva. Esta tecnologia não apenas reproduz detalhes com precisão, mas também simula vários efeitos de câmera, proporcionando aos usuários um controle semelhante ao de um diretor.

【Resumo AiBase:】

🖼️ Apenas uma imagem ou uma frase são necessárias para gerar cenários 3D realistas, abrindo uma nova experiência interativa.

🎥 A tecnologia suporta a simulação de vários efeitos de câmera, permitindo que os usuários controlem livremente a câmera no mundo 3D.

🚀 O World Labs planeja melhorar continuamente a escala e a precisão do mundo 3D, explorando mais formas de interação do usuário.

Link para detalhes: https://www.worldlabs.ai/blog

7. Adeus à violação de direitos autorais de clonagem de voz! Hume AI lança recurso de controle de voz, permitindo a criação de vozes de IA personalizadas.

O Hume AI lançou recentemente um recurso experimental chamado "controle de voz", permitindo que os usuários criem facilmente vozes de IA personalizadas, sem necessidade de habilidades de codificação. Este recurso permite que os usuários ajustem as características da voz usando controles deslizantes, oferecendo opções de personalização multidimensionais para atender a diversas necessidades de aplicação.

image.png

【Resumo AiBase:】

🔊 O Hume AI lança o recurso "controle de voz", permitindo que os usuários criem facilmente vozes de IA personalizadas.

🛠️ Este recurso não requer habilidades de codificação, os usuários podem ajustar as características da voz usando controles deslizantes.

🌐 O Hume visa atender a diversas necessidades de aplicação através de IA de voz personalizada e emocionalmente inteligente.

Link para detalhes: https://www.hume.ai/blog/introducing-voice-control

8. Cohere lança novo modelo de busca Rerank3.5: pode processar mais de 100 idiomas para consultas precisas.

O Rerank3.5, lançado recentemente pela Cohere, representa um grande avanço na recuperação de dados empresariais. Este modelo suporta consultas em mais de 100 idiomas, com desempenho excepcional em idiomas comerciais importantes como árabe, japonês e coreano, ajudando empresas multinacionais a superar barreiras linguísticas. Testes internos mostraram uma melhoria significativa no desempenho do Rerank3.5 no setor de serviços financeiros, permitindo economia de custos e redução de riscos.

image.png

【Resumo AiBase:】

📊 O Rerank3.5 pode processar consultas em mais de 100 idiomas, ajudando empresas globais a superar barreiras linguísticas.

💡 Testes internos mostraram uma grande melhoria no desempenho de busca do modelo no setor de serviços financeiros, permitindo economia de custos e redução de riscos.

🚀 A Cohere, através da implantação em plataformas de nuvem principais, busca se tornar o padrão do setor em busca empresarial, enquanto as empresas precisam se adaptar ao ambiente de IA em rápida mudança.

Link para detalhes: https://cohere.com/blog/rerank-3pt5

9. CFO da OpenAI responde a rumores de anúncios: atualmente não considera a introdução de um modelo de anúncios.

A diretora financeira da OpenAI, Sarah Friar, disse em uma entrevista que a empresa atualmente não tem planos de introduzir anúncios, embora a receita de anúncios seja uma opção atraente para empresas lucrativas. Friar mencionou que a OpenAI está crescendo rapidamente e encontrou oportunidades em seu modelo de negócios existente, e pode explorar outras fontes de receita no futuro.

【Resumo AiBase:】

🌟 A CFO da OpenAI, Sarah Friar, disse que atualmente não há intenção de introduzir anúncios, mas outras fontes de receita podem ser exploradas no futuro.

💼 A OpenAI contratou vários especialistas em publicidade e marketing, indicando que um modelo de anúncios pode ser considerado no futuro.

🚪 A alta rotatividade de executivos na empresa, com o fundador Sam Altman ainda trabalhando para impulsionar a visão da empresa.

10. O ChatGPT trava ao mencionar "David Mayer", qual é essa força misteriosa?

Recentemente, um fenômeno confuso surgiu nas mídias sociais: o chatbot ChatGPT da OpenAI não consegue responder normalmente ao mencionar "David Mayer" e encerra a conversa forçadamente. Este fenômeno gerou amplas discussões e especulações entre os usuários da internet, com muitos tentando perguntar ao ChatGPT sobre "David Mayer", mas encontrando o mesmo resultado.

image.png

【Resumo AiBase:】

🌐 O ChatGPT não consegue responder ao mencionar "David Mayer" e encerra a conversa forçadamente.

🔍 "David Mayer" pode estar relacionado a questões legais, envolvendo o direito ao esquecimento do GDPR.

🤔 Outros nomes também podem causar falhas no ChatGPT, destacando a complexidade dos modelos de IA.

11. WPS Office lança recurso de taquigrafia de voz com IA.

O WPS Office lançou recentemente um recurso de taquigrafia de voz com IA, melhorando a experiência de conversão de voz em texto, com suporte para gravação em tempo real e tradução entre vários idiomas. Este recurso usa reconhecimento de voz e resumo automático de IA para melhorar a precisão e integra-se profundamente ao WPS Cloud Document, garantindo que os usuários possam continuar gravando sem problemas durante o processo de gravação. Os usuários podem encontrar e usar facilmente este recurso na versão mais recente do WPS Office.

微信截图_20241203150637.png

【Resumo AiBase:】

🗣️ O recurso de taquigrafia de voz permite gravação em tempo real e conversão de áudio em texto.

🌐 Suporta recursos de tradução entre vários idiomas, como chinês e inglês.

🔒 Oferece uma experiência de colaboração de documentos segura, melhorando a conveniência do usuário.

12. Tencent lança o grande modelo de geração de vídeo Hunyuan: 130 bilhões de parâmetros totalmente abertos.

A Tencent lançou o modelo de geração de vídeo Hunyuan, com 130 bilhões de parâmetros, o maior modelo de geração de vídeo de código aberto atualmente. Este modelo suporta a geração de vídeos em alta definição e realistas, adequados para aplicações comerciais como publicidade e vídeos criativos. Os usuários podem experimentar ou conectar-se através do aplicativo Tencent Yuanbao e da interface da Tencent Cloud, reduzindo a barreira tecnológica para a geração de vídeo e promovendo a popularização da tecnologia de IA.