Bem-vindo à coluna 【AI日报】! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os principais tópicos do campo de IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA.

Novos produtos de IA Clique para saber mais:https://top.aibase.com/

1、IA doméstica contra-ataca! O novo modelo Yi-Lightning da Ling Yi supera o GPT-4o

Recentemente, foi divulgado o ranking de modelos de IA gerado por votação cega de milhões de usuários em todo o mundo. O modelo de IA doméstico "Yi-Lightning" fez uma reviravolta, superando o GPT-4, que ocupava o primeiro lugar há muito tempo.

QQ20241016-145235.jpg

【Resumo AiBase:】

🏆 O "Yi-Lightning" alcançou o topo, superando o GPT-4 e ocupando posições de destaque em várias sub-classificações, demonstrando sua força e inovação tecnológica.

⚡ O "Yi-Lightning" utiliza uma arquitetura de modelo de especialista híbrido e um mecanismo de atenção híbrido otimizado, processando dados de sequência longa de forma eficiente e compartilhando informações de forma mais eficaz.

💡 O "Yi-Lightning" pode selecionar dinamicamente a combinação mais adequada de redes especializadas, garantindo que ele lide com vários desafios com facilidade.

Link para mais detalhes:https://x.com/lmarena_ai/status/1846245604890116457

2、Modelo Marco-MT da Alibaba International: Um novo avanço na área de tradução de IA

O grande modelo de tradução Marco-MT lançado pela Alibaba International tem um significado importante no ambiente comercial global, melhorando a capacidade de tradução automática e apoiando a internacionalização do comércio eletrônico. Este modelo destaca-se pela precisão e sensibilidade cultural, com preços acessíveis e suporte para tradução entre várias línguas, tornando-se um valioso assistente para empresas que desejam expandir seus negócios para o exterior.

image.png

【Resumo AiBase:】

🌐 O modelo Marco-MT melhorou a capacidade de tradução automática, apresentando um desempenho excepcional no processamento de frases com contexto cultural rico.

💡 Através da análise aprofundada do contexto e do cenário, ele fornece resultados de tradução precisos, o que é particularmente importante para o setor de comércio eletrônico.

💰 O modelo Marco-MT tem uma excelente relação custo-benefício, suporta tradução entre várias línguas e é uma opção econômica para comerciantes de comércio eletrônico transfronteiriço.

Link para mais detalhes:https://aidc-ai.com/page/translation.htm#tryout

3、Livros didáticos de física "ganham vida"! Augmented Physics transforma gráficos estáticos em animações

Pesquisadores da Universidade de Calgary, no Canadá, desenvolveram a ferramenta Augmented Physics, que transforma gráficos estáticos de livros didáticos de física em simulações interativas, revolucionando o ensino de física. Essa tecnologia utiliza técnicas avançadas de visão computacional e modelos de linguagem grandes multimodais, permitindo que professores e alunos extraiam gráficos de páginas de livros e gerem simulações interativas, melhorando a experiência de aprendizagem.

Vídeo do oficial, tradução: Pequena Interação

【Resumo AiBase:】

✨ Utiliza tecnologia de visão computacional e modelos de linguagem grandes multimodais para transformar gráficos estáticos de física em simulações interativas.

🔬 Suporta várias simulações físicas, incluindo movimento newtoniano, óptica, circuitos e animações cíclicas.

⚙️ Os usuários podem interagir com os resultados da simulação selecionando objetos específicos para segmentação, manipulação e ajuste de parâmetros através de um processo de criação simples.

Link para mais detalhes:https://arxiv.org/pdf/2405.18614

4、O primeiro robô bípede humanoide TRON1 da Zhuji Power está oficialmente à venda

A Zhuji Power lançou seu primeiro robô bípede humanoide multi-forma, o TRON1, com preço de apenas 69.800 yuans. Ele possui capacidade de movimento excepcional, excelente resistência a impactos e suporta três designs de extremidades, sendo acessível para pesquisa e desenvolvedores iniciantes.

image.png

【Resumo AiBase:】

🌟 O TRON1 é o primeiro robô bípede humanoide multi-forma, com preço de apenas 69.800 yuans e suporte para três designs de extremidades.

🤖 Oferece SDK totalmente aberto e interfaces de hardware de baixo nível, com suporte para desenvolvimento Python, reduzindo a barreira de entrada para pesquisa.

💡 Fundada em 2022, a Zhuji Power recebeu apoio de instituições de investimento de renome e se concentra no desenvolvimento de robôs humanoides.

5、TANGO, uma solução poderosa que se aproxima do HeyGen

O TANGO é um projeto inovador que pode gerar vídeos de corpo inteiro perfeitamente sincronizados com o áudio. Sua principal vantagem reside em sua lógica de geração e base tecnológica exclusivas. Sua natureza de código aberto atrai desenvolvedores e entusiastas de tecnologia, com amplas perspectivas de aplicação e simplificação do processo de produção de vídeo. No entanto, em comparação com projetos semelhantes ao HeyGen, o TANGO fez avanços inovadores na geração de movimentos de corpo inteiro.

【Resumo AiBase:】

🔑 O TANGO suporta a geração de vídeos de corpo inteiro que correspondem ao áudio.

🚀 A lógica de geração do TANGO inclui análise de amostras, seleção da melhor sequência de movimentos e geração de quadros de transição suaves.

💡 A base tecnológica do TANGO é baseada em incorporação de movimento de áudio e algoritmos de interpolação de difusão.

Link para mais detalhes:https://pantomatrix.github.io/TANGO/

6、Filho usa IA para responder a perguntas e é punido, pai fica furioso! Processa a escola

Um caso de um estudante do ensino médio em Hingham, Massachusetts, que recebeu uma punição severa por usar IA gerou discussões no meio educacional sobre políticas de IA. Pais e advogados pedem que as escolas forneçam diretrizes mais claras sobre o uso da IA, enfatizando que a IA é uma ferramenta e que as coisas que podem e não podem ser feitas devem ser claramente definidas. A escola já publicou novas diretrizes sobre o uso da IA, e a National Education Association também aprovou uma política de IA para servir como referência para escolas e educadores.

【Resumo AiBase:】

🤖 O uso da IA na educação gera controvérsias, e o caso de Hingham, Massachusetts, atrai muita atenção.

🔍 Um aluno foi severamente punido por usar IA para coletar informações de pesquisa, e pais e advogados pedem que as escolas forneçam diretrizes claras.

💡 As escolas publicaram novas diretrizes sobre o uso da IA, e a National Education Association aprovou uma política de IA para servir como referência para educadores.

7、OpenAI recebe novo diretor de segurança da informação

A OpenAI passou por uma recente instabilidade de pessoal, mas com a chegada de Dane Stuckey, ex-diretor de segurança da informação da Palantir, a empresa recebe um novo impulso. Stuckey enfatiza a importância da segurança e apoiará a parceria da OpenAI com o governo. A empresa está fortalecendo sua equipe de segurança e contratando um novo líder para construir uma infraestrutura de IA segura.

【Resumo AiBase:】

🔒 Dane Stuckey ingressa na OpenAI como diretor de segurança da informação, enfatizando a importância da segurança.

🤝 A vasta experiência de Stuckey na Palantir apoiará a parceria da OpenAI com o governo.

🛡️ A OpenAI recentemente fortaleceu sua equipe de segurança e contratou um novo líder para construir uma infraestrutura de IA segura.

8、A tempestade de direitos autorais continua! O New York Times adverte severamente a empresa de mecanismos de busca de IA Perplexity para que pare de usar seu conteúdo

Recentemente, o renomado jornal New York Times emitiu uma ordem de cessação e desistência para uma startup de IA chamada Perplexity, exigindo que ela pare de usar seu conteúdo. Essa ação reacendeu o debate sobre direitos autorais, destacando a urgência de proteger os direitos dos criadores na era digital.

image.png

【Resumo AiBase:】

🌐 O New York Times enviou uma ordem de cessação e desistência à empresa de IA Perplexity, exigindo que ela pare de usar seu conteúdo.

⚖️ O New York Times já processou a OpenAI, acusando-a de usar uma grande quantidade de artigos sem autorização.

🔍 O serviço de "motor de respostas" fornecido pela Perplexity gerou uma nova rodada de discussões sobre direitos autorais.

9、Anthropic atualiza sua política de segurança, definindo um "limite de segurança" para evitar que a IA saia do controle

A Anthropic atualizou sua "Política de Expansão de Responsabilidade (RSP)", visando gerenciar efetivamente os riscos potenciais associados a sistemas de IA de alta capacidade. Essa política introduz um limite de capacidade, marcando claramente os salvaguardas de segurança adicionais quando a capacidade do modelo de IA aumenta, a fim de evitar o uso indevido da tecnologia. A criação do cargo de "responsável pela expansão de responsabilidades" supervisiona a conformidade e garante que as medidas de segurança estejam em vigor. A política atualizada visa estabelecer padrões de segurança para a indústria de IA, promovendo a transparência e a autorregulação.

【Resumo AiBase:】

🌟 A Anthropic atualizou sua "Política de Expansão de Responsabilidade", introduzindo um limite de capacidade para fortalecer o gerenciamento de riscos de IA.

🛡️ A nova política cria o cargo de "responsável pela expansão de responsabilidades" para supervisionar a execução e a conformidade com os protocolos de segurança de IA.

🚀 A política visa estabelecer padrões de segurança para a indústria de IA, promovendo a transparência e a autorregulação.

10、O Google AI lança Gemma-APS: Um novo modelo de análise de proposições para revolucionar a segmentação de texto

O Google AI lançou recentemente o Gemma-APS, um conjunto de modelos especializados em segmentação de texto para proposições, projetado para resolver os desafios enfrentados pelos modelos atuais de aprendizado de máquina no processamento de linguagem humana complexa. O Gemma-APS tem uma ampla gama de aplicações e demonstra desempenho excepcional, melhorando a eficiência dos modelos de linguagem e reduzindo o risco de deriva semântica durante o processo de análise de texto, o que é crucial para preservar o significado do texto original.

image.png

【Resumo AiBase:】

✨ O Gemma-APS é derivado do modelo Gemini Pro e treinado com dados sintéticos multidomínio, melhorando a versatilidade do modelo.

💡 O Gemma-APS pode segmentar de forma eficiente textos complexos em unidades de proposições significativas, estabelecendo uma base para tarefas posteriores de PNL, com precisão e eficiência computacional superiores aos modelos existentes.

🚀 O lançamento do Gemma-APS marca um avanço significativo na tecnologia de segmentação de texto e tem o potencial de mudar a maneira como textos complexos são interpretados e decompostos em aplicativos de PNL.

Link para mais detalhes:https://huggingface.co/collections/google/gemma-aps-release-66e1a42c7b9c3bd67a0ade88

11、FunASR lança pacote de software de transcrição off-line multilíngue

O pacote de software de transcrição off-line multilíngue lançado pela FunASR oferece aos usuários uma solução de conversão de voz para texto eficiente e precisa, especialmente adequada para profissionais que trabalham com grandes quantidades de material de áudio. Este pacote de software suporta várias línguas, fornece carimbos de tempo em nível de palavra e a função de palavras-chave personalizadas, integrando totalmente modelos avançados para garantir resultados de transcrição de alta qualidade. Os desenvolvedores podem desfrutar de bibliotecas de clientes ricas, com excelente desempenho em aplicações reais, suporte para processamento concorrente e normalização de tempo inicial, e implantação simples.

image.png

【Resumo AiBase:】

⚙️ A principal vantagem do pacote de software é sua capacidade de transcrição off-line de arquivos, capaz de processar arquivos de áudio ou vídeo de até várias horas de duração, gerando transcrições de texto com pontuação.

🌐 O suporte multilíngue inclui chinês, inglês, japonês, cantonês e coreano, mostrando uma excelente capacidade de reconhecimento de voz e fornecendo carimbos de tempo em nível de palavra para localização precisa do conteúdo de áudio.

🛠️ Oferece uma função de palavras-chave personalizadas, permitindo que os usuários definam termos ou nomes próprios para otimizar os resultados de reconhecimento, suporte para processamento paralelo de várias solicitações de transcrição, melhorando a eficiência do trabalho.

Link para mais detalhes:https://github.com/modelscope/FunASR/blob/main/runtime/docs/SDK_advanced_guide_offline.md