Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA clique para saber mais: https://top.aibase.com/

1、O céu dos designers desabou novamente! Teste interno do JiMeng 3.0: criação direta de pôsteres comerciais em 2K

O modelo JiMeng 3.0 alcançou um grande avanço na área de geração de imagens, capaz de gerar imagens de alta qualidade e ricas em detalhes através de prompts de texto simples. Seu controle preciso de cenários complexos e detalhes faz com que os efeitos visuais gerados superem o nível de desenho manual de designers tradicionais. Analistas do setor acreditam que o sucesso deste modelo se deve à atualização abrangente do algoritmo, e a velocidade de geração também é impressionante, fornecendo um forte suporte para a rápida iteração criativa.

image.png

【Resumo AiBase:】

🖼️ O JiMeng 3.0 apresenta um grande avanço na qualidade da imagem, capaz de gerar obras de arte ricas em detalhes.

⚙️ Este modelo foi significativamente aprimorado em termos de volume de dados de treinamento e estrutura de rede de geração, melhorando a capacidade de compreensão da intenção do usuário.

⏱️ Leva apenas alguns segundos da entrada do prompt à saída do produto final, aumentando muito a eficiência da iteração criativa.

2、O ChatGPT atualizou novamente a função de geração de imagens, desta vez até caligrafia cursiva ele escreve

Recentemente, a capacidade de geração de imagens do ChatGPT foi significativamente aprimorada, especialmente na geração de texto chinês. A nova versão não apenas suporta a geração de caligrafia cursiva, mas também apresenta melhorias significativas na renderização de detalhes e na compreensão de instruções complexas. Os usuários podem gerar imagens de alta qualidade com descrições simples, e essa capacidade de iteração rápida demonstra o profundo acúmulo da OpenAI na otimização de algoritmos. Além disso, a nova versão introduziu uma ferramenta de seleção, oferecendo maior flexibilidade aos criadores.

image.png

【Resumo AiBase:】

🎨 A nova versão do ChatGPT suporta a geração de caligrafia cursiva, com traços de caracteres completos e precisos.

🛠️ Introduzida a ferramenta de seleção, os usuários podem ajustar áreas específicas da imagem com precisão.

🚀 A renderização de detalhes e a harmonia de cores foram significativamente aprimoradas, atendendo às necessidades do usuário.

3、O Ele.me lança o "gerente inteligente de entrada de IA", novos comerciantes podem entrar em apenas 5 minutos

O Ele.me lançou recentemente o "gerente inteligente de entrada de IA", um assistente inteligente projetado para simplificar o processo de entrada de novos comerciantes. Ao iniciar um negócio de entrega de comida, todo o processo de entrada pode ser concluído em apenas 5 minutos, aumentando significativamente a eficiência. Este assistente oferece serviço de conversação em linguagem natural 24 horas por dia, permitindo que os comerciantes concluam a autenticação de identidade, assinatura de autorização e upload de materiais em uma única etapa, evitando o processo tedioso de preenchimento manual de formulários de inscrição anteriores.

image.png

【Resumo AiBase:】

🍔 O Ele.me lança o gerente inteligente de entrada de IA, os comerciantes podem entrar no serviço de entrega em apenas 5 minutos.

🤖 Este assistente inteligente oferece serviço 24 horas por dia, suportando o upload de materiais, autenticação de identidade e outros processos de entrada em uma única etapa.

💰 O Ele.me planeja investir mais de 1 bilhão de yuans até 2025, continuando a fortalecer o suporte de aplicação de tecnologia de IA.

4、Hugging Face adiciona nova função prática: verifique com um clique os modelos que seu computador pode executar

O Hugging Face lançou um novo recurso que permite aos usuários verificar facilmente quais modelos de aprendizado de máquina seu hardware pode executar. Os usuários precisam apenas adicionar informações de hardware nas configurações pessoais, e o sistema analisará e exibirá os modelos executáveis de forma inteligente. Este recurso simplifica o processo de seleção do modelo, especialmente amigável para desenvolvedores e entusiastas de IA.

image.png

【Resumo AiBase:】

🛠️ Os usuários podem adicionar informações de hardware por meio das configurações, e o sistema exibirá os modelos de aprendizado de máquina executáveis.

📊 Este recurso é intuitivo e conveniente, simplificando o processo de seleção de modelos para desenvolvedores e pesquisadores.

🔗 O novo recurso é complementar a outras ferramentas do ecossistema Hugging Face, melhorando a eficiência do desenvolvimento.

5、A ByteDance lança o MegaTTS3 no Hugging Face: um novo avanço na síntese de fala leve

A ByteDance lançou seu mais recente modelo de texto para fala, o MegaTTS3, no Hugging Face, atraindo a atenção de pesquisadores de IA em todo o mundo. Este modelo é conhecido por seu design leve e suporte multilíngue, com apenas 45 milhões de parâmetros, adequado para uso em dispositivos com recursos limitados. O MegaTTS3 não apenas suporta leitura mista de chinês e inglês, mas também possui uma função de controle de intensidade do sotaque, melhorando ainda mais a possibilidade de aplicativos de voz personalizados.

image.png

【Resumo AiBase:】

🛠️ O MegaTTS3 é uma ferramenta de síntese de fala leve desenvolvida pela ByteDance em colaboração com a Universidade de Zhejiang, com apenas 45 milhões de parâmetros, adequado para dispositivos com recursos limitados.

🌍 Suporta leitura mista de chinês e inglês e controle de intensidade do sotaque, os usuários podem gerar saída de voz diversificada para atender às necessidades personalizadas.

📥 O código-fonte e o modelo foram lançados no GitHub e no Hugging Face, promovendo a popularização e inovação da tecnologia de IA.

Link para detalhes:https://huggingface.co/ByteDance/MegaTTS3

6、Correção de custo do modelo o3 da OpenAI: o preço por tarefa pode chegar a US$ 30.000

A Arc Prize Foundation fez uma grande revisão da estimativa de custo do modelo de IA de raciocínio o3 da OpenAI, prevendo que o custo de cada tarefa ARC-AGI chegará a US$ 30.000, dez vezes mais do que os US$ 3.000 iniciais. Embora o o3 ainda não tenha sido lançado oficialmente, a Arc Prize Foundation acredita que o custo do modelo o1-pro reflete melhor a situação real do o3.

image.png

【Resumo AiBase:】

💸 Correção de custo: o custo de cada tarefa ARC-AGI do modelo o3 foi ajustado de US$ 3.000 para US$ 30.000, mostrando altos custos operacionais.

🖥️ Requisitos de computação: a configuração alta do o3 requer 172 vezes mais poder de computação do que a configuração baixa do o3 para resolver problemas ARC-AGI, refletindo a complexidade do modelo.

📈 Planos corporativos: a OpenAI pode lançar planos de alto preço para clientes corporativos, com uma taxa mensal de até US$ 20.000 para agentes de IA profissionais.

7、Genspark lança o agente de IA automatizado Super Agent com capacidade de pensamento independente e uso de ferramentas

A Genspark lançou recentemente seu novo agente de IA automatizado, o Super Agent, que se tornou rapidamente o foco da indústria com sua poderosa capacidade de pensamento independente e execução de tarefas. Este sistema utiliza um design inovador de sistema híbrido de múltiplos agentes, capaz de lidar com tarefas de forma eficiente em vários cenários, mostrando um enorme potencial desde assuntos cotidianos até pesquisas complexas. Apesar de sua impressionante utilidade, ainda é necessário resolver alguns problemas relacionados à transparência do sistema e à privacidade de dados.

image.png

【Resumo AiBase:】

🚀 O Super Agent, através do design de sistema híbrido de múltiplos agentes, integra oito grandes modelos de linguagem, melhorando a flexibilidade e precisão do processamento de tarefas.

🛠️ Este sistema é equipado com mais de 80 ferramentas, capaz de interagir perfeitamente com sistemas externos, completando tarefas de todo o processo, desde a recuperação de informações até a operação real.

🔍 Embora o Super Agent tenha um desempenho excelente, seus detalhes de implementação específicos ainda não foram totalmente divulgados, e seu desempenho em tarefas complexas ainda precisa ser verificado no futuro.

Link para detalhes:https://top.aibase.com/tool/genspark

8、OpenAI lança o PaperBench, um benchmark para avaliação de agentes de IA

A equipe da OpenAI lançou o benchmark PaperBench, projetado para avaliar a capacidade dos agentes de IA de replicar pesquisas avançadas em IA. Este teste exige que os agentes de IA repliquem do zero 20 artigos importantes e orais da conferência internacional de aprendizado de máquina de 2024, envolvendo a compreensão das contribuições do artigo, o desenvolvimento de bibliotecas de código e a execução bem-sucedida de experimentos. A equipe de pesquisa projetou critérios de avaliação detalhados e desenvolveu um sistema de avaliação automática baseado em grandes modelos de linguagem.

image.png

【Resumo AiBase:】

🌟 O PaperBench é um novo benchmark para avaliar a capacidade dos agentes de IA de replicar pesquisas em IA, envolvendo 20 artigos do ICML2024.

🔍 Este teste projetou 8316 tarefas que podem ser avaliadas individualmente, e os critérios de avaliação foram desenvolvidos em conjunto com os autores dos artigos.

🤖 O Claude3.5Sonnet foi o modelo de melhor desempenho no teste, mas ainda não superou os principais pesquisadores humanos.

Link para detalhes:https://github.com/openai/preparedness/tree/main/project/paperbench

9、Ranking de receita de distribuidores móveis globais de 2024 lançado, OpenAI entra na lista pela primeira vez

A lista "Top 50 de receita de distribuidores móveis globais de 2024" publicada pela Sensor Tower mostra que o valor total pago do mercado global de aplicativos móveis ultrapassou US$ 150 bilhões pela primeira vez, com um crescimento de 13%. A Tencent continua liderando, seguida pela ByteDance. A ascensão da tecnologia de IA fez com que a OpenAI entrasse na lista pela primeira vez, mostrando seu progresso no campo da análise de usuários e recomendações personalizadas. A ascensão dos jogos casuais híbridos também trouxe novas oportunidades para os jogos tradicionais, e empresas como Scopely e Dream Games tiveram um desempenho destacado, mostrando o potencial de pequenas e médias empresas.

image.png

【Resumo AiBase:】

🎮 A Tencent continua liderando os distribuidores móveis globais com uma vantagem absoluta, graças à sua rica linha de produtos e à sua vasta base de usuários.

📊 A ByteDance, por meio de sua estratégia de globalização do TikTok, alcançou um crescimento de receita de 38,2%, mantendo-se em segundo lugar.

🤖 A OpenAI entra pela primeira vez no Top 50 global, mostrando um progresso significativo nas áreas de análise de usuários e geração de conteúdo.

10、Previsão do Google DeepMind: até 2030, a IAG pode superar os humanos e lançar estratégias de segurança

O Google DeepMind lançou recentemente um documento estratégico detalhando sua abordagem para o desenvolvimento de inteligência artificial geral segura (IAG). A IAG é definida como um sistema capaz de igualar ou superar os humanos na maioria das tarefas cognitivas. O DeepMind prevê que os métodos atuais de aprendizado de máquina, especialmente as redes neurais, serão o principal caminho para a realização da IAG.

image.png

【Resumo AiBase:】

💡 Os sistemas de IAG podem superar as capacidades humanas antes de 2030, afetando várias áreas.

🔒 O DeepMind está focado na prevenção do mau uso da IA e no desvio de objetivos, lançando estratégias de segurança multicamadas.

⚡ O relatório analisa as restrições de infraestrutura e acredita que a continuação da expansão é economicamente viável.

11、NotebookLM lança a função “Descobrir fontes”, o sistema coleta automaticamente fontes online ao inserir um tópico

O NotebookLM do Google lançou um novo recurso, “Descobrir fontes”, projetado para ajudar os usuários a obter rapidamente informações relevantes na web. Os usuários precisam apenas inserir o tópico de interesse, e o sistema encontrará rapidamente as páginas da web relevantes e as resumirá. Os usuários podem adicionar essas fontes ao notebook com um clique para facilitar a consulta.

image.png

【Resumo AiBase:】

{'emoji': '🌐', 'content': 'Novo recurso: O NotebookLM lança “Descobrir fontes”, permitindo que os usuários obtenham informações online rapidamente.'}