Bem-vindo à seção 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo da IA, com foco em desenvolvedores, para ajudá-lo a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Saiba mais: https://top.aibase.com/

1. O grande modelo de interação multimodais iFlytek Spark é lançado, realizando a integração “três em um” de “interação de voz, visão e pessoa digital”

O mais recente modelo de interação multimodais iFlytek Spark, lançado pela iFlytek, marca uma nova fase na expansão da empresa de tecnologia de interação de voz única para interação multimodais em tempo real de fluxo de áudio e vídeo. Este modelo integra funções de interação de voz, visão e pessoa digital, realizando uma combinação perfeita entre as três, introduzindo tecnologia de pessoa digital super-humana, melhorando a vivacidade e o realismo da IA. O novo modelo realiza expressões emocionais mais reais e coerentes por meio da consistência semântica multimodais, suporta tecnologia de interação ultrarrápida super-humana e fornece uma experiência de interação personalizada. A interação visual multimodais permite que o modelo perceba completamente o cenário de fundo e o estado da logística, fornecendo aos usuários uma experiência de interação mais rica e precisa.

image.png

【Resumo AiBase:】

🌟 A iFlytek lançou o grande modelo de interação multimodais iFlytek Spark, integrando as funções de interação de voz, visão e pessoa digital, realizando uma combinação perfeita.

🔥 Introduzindo tecnologia de pessoa digital super-humana, os movimentos da pessoa digital correspondem precisamente ao conteúdo de voz, melhorando a vivacidade e o realismo da IA.

💡 Suporta tecnologia de interação ultrarrápida super-humana, realizando modelagem de ponta a ponta de voz para voz, fornecendo uma experiência de interação personalizada.

Link para detalhes: https://www.xfyun.cn/solutions/Multimodel

2. Anthropic lança novo recurso de otimização de prompt

O novo recurso de otimização de prompt lançado pela Anthropic trouxe enorme conveniência aos desenvolvedores, melhorando a confiabilidade e a eficiência dos aplicativos de IA. O otimizador aprimora automaticamente os prompts por meio de tecnologia de engenharia avançada, com uma precisão 30% maior e uma precisão de contagem de palavras de 100%, permitindo que os usuários forneçam feedback para melhorias adicionais. O recurso de gerenciamento de exemplos permite que os desenvolvedores gerenciem exemplos de forma estruturada, simplificando os processos. A Kapa.ai migrou com sucesso vários fluxos de trabalho de IA para a plataforma Claude e elogiou o otimizador por acelerar os processos de produção.

image.png

【Resumo AiBase:】

🔍 O novo recurso de otimização de prompt melhora a confiabilidade e a eficiência dos aplicativos de IA.

🚀 O otimizador aprimora automaticamente os prompts, com uma precisão 30% maior e uma precisão de contagem de palavras de 100%.

💡 O recurso de gerenciamento de exemplos simplifica o processo de gerenciamento de exemplos; a Kapa.ai migrou com sucesso vários fluxos de trabalho de IA para a plataforma Claude.

Link para detalhes: https://www.anthropic.com/news/prompt-improver

3. Grande atualização! O aplicativo de desktop ChatGPT para Windows é lançado totalmente, e a versão macOS adiciona recursos de colaboração com aplicativos

A OpenAI lançou uma atualização importante, melhorando a praticidade do ChatGPT nos sistemas Windows e Mac. O aplicativo de desktop para Windows foi lançado oficialmente, e a versão de teste do macOS está profundamente integrada a aplicativos de codificação populares, tornando-se um assistente em tempo real. Isso representa uma grande vantagem para os desenvolvedores.

image.png

【Resumo AiBase:】

🚀 O aplicativo de desktop ChatGPT para Windows foi lançado totalmente, melhorando a experiência do usuário.

💻 O macOS adicionou recursos de colaboração com aplicativos, permitindo que os desenvolvedores analisem código diretamente e obtenham sugestões inteligentes.

📈 A OpenAI planeja expandir o suporte a mais aplicativos, ajudando a melhorar a praticidade das ferramentas de IA no trabalho de desktop.

Link para detalhes: https://openai.com/chatgpt/desktop/?ref=maginative.com

4. Lançamento da versão Windows da estação de trabalho inteligente de IA da Tencent, ima.copilot

A versão Windows do ima.copilot (abreviado como ima), lançada pela Tencent, não apenas possui recursos de pesquisa, mas também pode responder a perguntas, criar texto e gerar imagens, mostrando a força tecnológica e a exploração aprofundada da Tencent no campo da inteligência artificial. O recurso de pesquisa particularmente atraente do ima integra recursos de artigos de contas públicas do WeChat, enriquecendo os resultados da pesquisa e melhorando a eficiência e a qualidade da obtenção de informações. O ima suporta o processamento de arquivos locais, tradução de vários idiomas, fornece um banco de dados de conhecimento pessoal e serviços de assistente pessoal online 24 horas por dia, oferecendo aos usuários uma experiência de trabalho e estudo conveniente e eficiente.

image.png

【Resumo AiBase:】

🔍 O recurso de pesquisa integra recursos de artigos de contas públicas do WeChat, enriquecendo os resultados da pesquisa e melhorando a eficiência e a qualidade da obtenção de informações.

📄 Processa arquivos locais, resume automaticamente o conteúdo, gera mapas mentais e suporta tradução de vários idiomas, facilitando a compreensão e o uso de materiais em diferentes idiomas pelos usuários.

📚 Fornece serviços de banco de dados de conhecimento pessoal e assistente pessoal online 24 horas por dia, criando uma biblioteca exclusiva para os usuários e oferecendo uma experiência de trabalho e estudo conveniente e eficiente.

Link para detalhes: https://ima.qq.com/

5. Uma frase para gerar aplicativos! O modo de código do Alibaba Tongyi é lançado

O laboratório Alibaba Tongyi lançou o modo de código, permitindo que os usuários gerem vários aplicativos por meio de instruções simples em linguagem cotidiana, incluindo pequenos jogos, gráficos de dados, sites e currículos. Os usuários precisam apenas acessar a versão web do Tongyi, clicar em “modo de código” para começar a experimentar a nova forma de interação. O modo de código é especialmente conveniente para usuários não programadores, suportando modelos de aplicativos populares predefinidos, como currículos pessoais e o pequeno jogo 2048. Com base no Qwen2.5-Coder, o desempenho e a eficiência da programação de IA são aprimorados.

image.png

【Resumo AiBase:】

👩‍💻 O modo de código Tongyi permite que os usuários gerem vários aplicativos por meio de instruções simples, incluindo pequenos jogos e gráficos de dados.

🌐 Os usuários podem acessar a versão web do Tongyi e clicar em “modo de código” para começar a experimentar a nova forma de interação.

🚀 O modo de código é baseado no Qwen2.5-Coder, melhorando o desempenho e a eficiência da programação de IA.

6. Novas habilidades para o robô Spot da Boston Dynamics: desvio fácil de obstáculos como fios e escadas!

O robô-cão Spot da Boston Dynamics recebeu recentemente uma importante atualização de software, melhorando significativamente sua capacidade de se mover em ambientes complexos. Esta atualização não apenas aprimorou a capacidade de navegação autônoma do Spot, mas também estabeleceu uma base para seu uso em ambientes mais complexos.

image.png

【Resumo AiBase:】

🐶 O robô Spot agora pode identificar e evitar automaticamente obstáculos como fios e escadas.

🤖 Um misterioso robô dinossauro apareceu no vídeo mais recente, despertando a curiosidade dos espectadores.

📈 A atualização de software torna a capacidade de navegação do Spot mais forte, expandindo suas perspectivas de aplicação.

7. O Google Gemini Exp1114 surge! Na primeira batalha, ele supera o GPT-4, alcançando o topo em várias avaliações de capacidade e causando impacto na indústria

A versão experimental mais recente do Gemini (Exp1114) do Google alcançou resultados notáveis na plataforma Chatbot Arena, superando os concorrentes e mostrando uma força impressionante. O Gemini-Exp-1114 empatou em primeiro lugar com o GPT-4-latest com uma excelente pontuação superior a 40 pontos, alcançando o topo em áreas centrais como matemática, prompts complexos e escrita criativa. Analistas da indústria acreditam que este avanço inovador mostra que os investimentos de longo prazo do Google em IA estão começando a gerar resultados.

image.png

【Resumo AiBase:】

🚀 O Gemini-Exp-1114 superou o GPT-4-latest na pontuação geral, mostrando uma forte capacidade abrangente.

💡 O Gemini-Exp-1114 alcançou o topo em áreas centrais como matemática, prompts complexos e escrita criativa, com um desempenho impressionante.

🔗 O avanço inovador do Gemini-Exp-1114 mostra que os investimentos de longo prazo do Google em IA estão começando a gerar resultados, gerando discussões e atenção na indústria.

8. O TikTok lança em grande estilo a ferramenta de criação de vídeo de IA Symphony, capacitando todo o processo de criação de anúncios comerciais

O TikTok anunciou a abertura total do Symphony Creative Studio, oferecendo aos anunciantes e criadores de conteúdo uma experiência de criação sem precedentes, tornando a produção de vídeos mais simples e eficiente, sem custos adicionais. Isso marca uma intensificação da competição entre plataformas de mídia social no campo de ferramentas criativas de IA e mostra a força tecnológica do TikTok na área de criação de vídeos de IA e sua determinação no processo de comercialização.

【Resumo AiBase:】

🚀 O Symphony Creative Studio integra funções de geração, conversão e expansão de vídeo, ajudando anunciantes e criadores a superar os gargalos da criatividade para a produção, oferecendo a função de geração rápida de conteúdo de vídeo.

👥 Suporta a criação de vídeos com personagens virtuais de IA, os usuários podem escolher personagens virtuais prontos ou personalizados, e o sistema gera vídeos automaticamente, permitindo que os anunciantes otimizem ainda mais.

🎨 Oferece funções de dublagem e tradução de vídeo, edição de vídeos existentes, etc., gerando automaticamente conteúdo de vídeo com base nas atividades históricas dos anunciantes, oferecendo aos anunciantes uma experiência de produção de conteúdo mais eficiente e criativa.

9. IA jogando Minecraft: grande confronto! O novo nível de construção do Claude impressiona a web

Recentemente, uma avaliação de capacidade de IA única foi realizada na plataforma Minecraft, chamando a atenção generalizada. As versões antiga e nova do Claude3.5Sonnet realizaram uma batalha de construção no jogo, mostrando uma diferença de capacidade óbvia, com a nova versão Sonnet3.6 se destacando. A avaliação foi apelidada de único padrão de avaliação confiável, recebeu o apoio da comunidade de código aberto e foi lançada no GitHub. O processo de construção da IA no jogo não depende da compreensão visual, fornecendo instruções de operação geradas em contexto na forma de texto.

image.png

【Resumo AiBase:】

🌟 O Sonnet3.6 venceu em termos de criatividade, recebendo o apoio de mais de 2.000 usuários.

🧠 O processo de construção da IA não depende da compreensão visual, fornecendo instruções de operação geradas em contexto na forma de texto.

🔧 A equipe do projeto planeja melhorar ainda mais o mecanismo de avaliação, criando um sistema de pontuação semelhante à arena Lmsys, usando o algoritmo Elo para classificação com base nos votos dos usuários.

Link para detalhes: https://x.com/mckaywrigley/status/1849613686098506064

10. Pony.ai inicia oficialmente o IPO, com previsão de arrecadar até US$ 378 milhões

A Pony.ai iniciou oficialmente o IPO, planejando listar na Nasdaq e arrecadar até US$ 378 milhões. Várias montadoras participaram da subscrição, promovendo a cooperação tecnológica Robotaxi e o planejamento global. 【Resumo AiBase:】

🌟 A Pony.ai inicia o IPO, planejando listar na Nasdaq e arrecadar até US$ 378 milhões.

🚗 Os fundos serão principalmente usados para a comercialização de serviços de direção autônoma e pesquisa e desenvolvimento tecnológico.

🤝 Várias montadoras participaram da subscrição, promovendo a cooperação tecnológica Robotaxi e o planejamento global.