Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas

Meta lança mecanismo de atenção System2Attention, melhorando a capacidade de raciocínio de modelos de linguagem

站长之家

Publicado emNotícias e Informações de IA · 1 minutos de leitura · Nov 24, 2023

Pesquisadores do Meta publicaram recentemente um novo estudo sobre a arquitetura Transformer, apresentando um novo mecanismo de atenção chamado System2Attention. Este mecanismo melhora a capacidade de raciocínio de modelos de linguagem ao ajustar sua atenção, resolvendo problemas de raciocínio insuficiente em tarefas complexas. Experimentos demonstraram que o System2Attention se destaca em diferentes tarefas, oferecendo uma solução inovadora para melhorar a capacidade de raciocínio de grandes modelos de linguagem.

Meta Modelos de Linguagem System2Attention

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Li Yanhong lança modelos de linguagem duplo para Ernie: X1 Turbo focado no DeepSeek 4.5 Turbo e superando o GPT-4o

Li Yanhong, CEO da Baidu, anunciou recentemente o lançamento de dois novos modelos de linguagem grandes, X1 Turbo e o Ernie 4.5 Turbo. O X1 Turbo é projetado para competir diretamente com o DeepSeek 4.5 Turbo, enquanto o Ernie 4.5 Turbo visa superar o GPT-4o em desempenho.

Apr 25, 2025

Zhihu anuncia redução de preços em vários modelos de linguagem, com GLM-4-Plus caindo 90%

A plataforma Zhihu BigModel anunciou um ajuste de preços em vários de seus modelos. O modelo GLM-4-FlashX, por exemplo, agora custa apenas 10 yuans por 100 milhões de tokens. Baseado em uma poderosa base pré-treinada, ele oferece velocidade de inferência ultrarrápida e capacidades de chamada de função comparáveis ao GPT-4, com excelente desempenho em extração, geração e tradução de dados.

Apr 24, 2025

Transformação acelerada da tecnologia bancária: modelos de linguagem grandes aplicados a negócios centrais

Com os desafios e pressões crescentes que o setor bancário enfrenta em sua transformação digital, cada vez mais bancos estão integrando a tecnologia de modelos de linguagem grandes em seus negócios centrais, indo além de simples aplicativos de chatbot. Dados recentes de relatórios financeiros mostram que alguns dos principais bancos domésticos fizeram progressos significativos em investimentos em tecnologia e na aplicação de modelos de linguagem grandes, mas também revelam uma tendência de diferenciação de investimentos. De acordo com uma análise do aplicativo de mídia de titânio de dez bancos principais, incluindo os seis grandes bancos estatais e alguns bancos comerciais, seis deles tiveram uma redução nos investimentos em tecnologia. Por exemplo,

Apr 18, 2025

Tencent cria aplicativos de IA empresarial prontos para uso

A Conferência Global de Ecossistema Digital da Tencent de 2025 foi inaugurada em Chengdu, e a Tencent anunciou seu mais novo aplicativo de IA empresarial: o Mecanismo de Conhecimento de Modelos de Linguagem Grandes da Tencent Cloud. Esta ferramenta inovadora visa fornecer a empresas de todos os tipos capacidades atômicas e modelos de desenvolvimento de aplicativos mais flexíveis, ajudando-as a construir seus próprios sistemas de gerenciamento de conhecimento. O Mecanismo de Conhecimento de Modelos de Linguagem Grandes da Tencent Cloud já foi implantado com sucesso em vários setores, incluindo finanças, energia, transporte, varejo, saúde, governo, educação e turismo. Por meio desta plataforma, muitas empresas, como a Sichuan Wen...

Apr 18, 2025

Hugging Face adquire Pollen Robotics, abrindo um novo capítulo para robótica

Em 15 de abril, a Hugging Face, renomada plataforma de modelos de linguagem abertos, anunciou a aquisição da Pollen Robotics, marcando sua entrada oficial no campo da robótica física. Embora os termos específicos da transação ainda não tenham sido divulgados, essa aquisição integrará aproximadamente 20 funcionários da Pollen Robotics à equipe da Hugging Face. Esta é a maior aquisição de pessoal da empresa até o momento, demonstrando sua ambição em expandir seus negócios. O cofundador da Hugging Face...

Apr 16, 2025

Hugging Face, plataforma líder de modelos de linguagem abertos, avança para o setor de robótica com a aquisição da Pollen Robotics

Recentemente, a Hugging Face, plataforma de desenvolvimento de inteligência artificial, anunciou oficialmente a aquisição da Pollen Robotics, startup francesa de robôs humanoides, marcando sua entrada estratégica no setor de robótica. Os detalhes financeiros da transação não foram divulgados, mas geraram grande interesse. Fundada em 2016 pelos engenheiros Matthieu Lapeyre e Pierre Rouanet, a Pollen Robotics desenvolveu o Reachy2, um robô humanoide avançado, que já está presente na Universidade Cornell...

Apr 16, 2025

Pré-treinamento não significa mais poderoso: estudo revela o fenômeno de overfitting catastrófico em grandes modelos de linguagem

Apr 14, 2025

Notícias de IA enfrentam resistência pública: metade dos americanos rejeita reportagens escritas por máquinas

Uma pesquisa recente revela que aproximadamente metade da população americana se opõe à utilização de inteligência artificial na produção de notícias. A resistência se deve a preocupações com a precisão, a imparcialidade e o impacto potencial na indústria jornalística.

Apr 14, 2025

Laboratório de IA de Xangai lança modelos de linguagem grandes multimodais InternVL3 de código aberto

O OpenGVLab lançou os modelos InternVL3, marcando um novo marco na área de modelos de linguagem grandes multimodais (MLLM). A série InternVL3 inclui 7 modelos de diferentes tamanhos, de 1B a 78B parâmetros, capazes de processar simultaneamente texto, imagens e vídeos, demonstrando um desempenho geral excepcional.

Apr 14, 2025

Tesla amplia contratações em ritmo acelerado para atingir meta de produção inicial do robô humanoide Optimus

A Tesla está acelerando seu projeto de robô humanoide Optimus, com o objetivo de alcançar a produção em massa inicial. Segundo as últimas notícias, a Tesla aumentou significativamente suas contratações recentemente, adicionando dezenas de vagas relacionadas ao Optimus, abrangendo diversas áreas como engenharia de manufatura, gestão de produção e desenvolvimento tecnológico. Essa iniciativa demonstra o comprometimento da Tesla em atingir sua meta de produzir os primeiros robôs Optimus até 2025, além de aprofundar a colaboração com parceiros para impulsionar a comercialização da tecnologia de robôs humanoides. Atualmente, as contratações da Tesla...

Apr 10, 2025