Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas

Together AI lança o conjunto de dados RedPajama v2 para treinamento de modelos de linguagem grandes

站长之家

Publicado emNotícias e Informações de IA · 2 minutos de leitura · Nov 6, 2023

A Together AI lançou o conjunto de dados RedPajama v2, contendo 30 trilhões de tokens, para treinamento de modelos de linguagem grandes. Este conjunto de dados visa apoiar o desenvolvimento bem-sucedido de modelos de linguagem grandes, fornecendo recursos de dados de alta qualidade.

O conjunto de dados é derivado do CommonCrawl e de outros dados da web pública, contendo mais de 40 clusters de anotações de qualidade e desduplicação. O conjunto de dados RedPajama v2 passou por um processamento mínimo, mantendo os dados originais para permitir o processamento posterior pelos criadores de modelos.

Esta iniciativa fornecerá mais recursos para o desenvolvimento e pesquisa de modelos de linguagem, esperando-se que impulsione o avanço adicional no campo da IA.

Conjunto de dados de IA Modelos de linguagem grandes Together AI

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Transformação acelerada da tecnologia bancária: modelos de linguagem grandes aplicados a negócios centrais

Com os desafios e pressões crescentes que o setor bancário enfrenta em sua transformação digital, cada vez mais bancos estão integrando a tecnologia de modelos de linguagem grandes em seus negócios centrais, indo além de simples aplicativos de chatbot. Dados recentes de relatórios financeiros mostram que alguns dos principais bancos domésticos fizeram progressos significativos em investimentos em tecnologia e na aplicação de modelos de linguagem grandes, mas também revelam uma tendência de diferenciação de investimentos. De acordo com uma análise do aplicativo de mídia de titânio de dez bancos principais, incluindo os seis grandes bancos estatais e alguns bancos comerciais, seis deles tiveram uma redução nos investimentos em tecnologia. Por exemplo,

Apr 18, 2025

Tencent cria aplicativos de IA empresarial prontos para uso

A Conferência Global de Ecossistema Digital da Tencent de 2025 foi inaugurada em Chengdu, e a Tencent anunciou seu mais novo aplicativo de IA empresarial: o Mecanismo de Conhecimento de Modelos de Linguagem Grandes da Tencent Cloud. Esta ferramenta inovadora visa fornecer a empresas de todos os tipos capacidades atômicas e modelos de desenvolvimento de aplicativos mais flexíveis, ajudando-as a construir seus próprios sistemas de gerenciamento de conhecimento. O Mecanismo de Conhecimento de Modelos de Linguagem Grandes da Tencent Cloud já foi implantado com sucesso em vários setores, incluindo finanças, energia, transporte, varejo, saúde, governo, educação e turismo. Por meio desta plataforma, muitas empresas, como a Sichuan Wen...

Apr 18, 2025

Laboratório de IA de Xangai lança modelos de linguagem grandes multimodais InternVL3 de código aberto

O OpenGVLab lançou os modelos InternVL3, marcando um novo marco na área de modelos de linguagem grandes multimodais (MLLM). A série InternVL3 inclui 7 modelos de diferentes tamanhos, de 1B a 78B parâmetros, capazes de processar simultaneamente texto, imagens e vídeos, demonstrando um desempenho geral excepcional.

Apr 14, 2025

PaddlePaddle 3.0 Lançado oficialmente: Suporte para modelos de linguagem grandes como o Wenxin 4.5 e redução de 80% nos custos de adaptação entre chips

O PaddlePaddle, plataforma de aprendizado profundo da Baidu, anunciou recentemente o lançamento oficial de sua nova geração de framework, o PaddlePaddle 3.0. Este lançamento introduz cinco inovações tecnológicas principais, incluindo o "Paralelismo Automático Unificado Estático e Dinâmico", visando reduzir efetivamente os custos de desenvolvimento e treinamento de modelos de linguagem grandes e impulsionar a construção de infraestrutura para a era dos modelos de linguagem grandes. Como infraestrutura fundamental para tarefas de treinamento e inferência de modelos de linguagem grandes, o framework PaddlePaddle 3.0 apresenta excelente desempenho em otimização. O framework já suporta vários modelos de linguagem grandes, incluindo Wenxin 4.5 e Wenxin X1, e através de otimizações...

Apr 2, 2025

Pesquisadores de IA da Nvidia lançam técnica de fusão FFN: Acelera a inferência de modelos de linguagem grandes

Mar 31, 2025

150

AMD lança projeto open source GAIA para execução eficiente de modelos de linguagem grandes locais

Recentemente, a AMD anunciou o lançamento de um aplicativo open source chamado GAIA, projetado para fornecer aos usuários uma maneira eficiente e local de executar modelos de linguagem grandes (LLM). Atualmente, o aplicativo é compatível com a plataforma Windows e foi otimizado especificamente para processadores da série Ryzen AI 300, aproveitando ao máximo as vantagens desses processadores em tarefas de IA. O GAIA é um aplicativo de IA generativo que permite aos usuários executar LLMs em seus computadores pessoais de forma privada, garantindo a privacidade dos dados. Além disso, o GAIA utiliza...

Mar 24, 2025

Equipe da CMU apresenta Meta Reinforcement Fine-Tuning (MRT): um novo paradigma para aprimorar o raciocínio de modelos de linguagem grandes

No campo da inteligência artificial, os modelos de linguagem grandes (LLM) estão em constante evolução. Recentemente, pesquisadores da Universidade Carnegie Mellon (CMU) e HuggingFace apresentaram um novo método chamado "Meta Reinforcement Fine-Tuning" (MRT). Este método visa otimizar a eficiência computacional dos modelos de linguagem grandes durante o teste, especialmente ao resolver problemas complexos de raciocínio, mostrando resultados excepcionais. Estudos demonstram que os modelos de linguagem grandes existentes apresentam dificuldades no processo de raciocínio...

Mar 13, 2025

xAI Grok-3 supera o GPT4.5 e conquista o topo da arena de modelos de linguagem grandes

A xAI anunciou recentemente uma notícia emocionante: seu mais recente modelo de IA, Grok-3, obteve um desempenho excepcional no ranking do Chatbot Arena. O modelo, denominado "grok-3preview-02-24", demonstrou desempenho superior em várias áreas-chave. O Grok-3-Preview-02-24 da xAI superou o GPT4.5-Preview por uma pequena margem de 1 ponto. O Grok-3 recebeu mais de 3.000 votos e, no geral,

Mar 4, 2025

ByteDance lança AIBrix: novo sistema de inferência de código aberto projetado para modelos de linguagem grandes

Feb 28, 2025

Microsoft lança OmniParser V2 de código aberto: permitindo que modelos de linguagem grandes 'compreendam' e operem interfaces gráficas do usuário

A Microsoft lançou recentemente uma versão atualizada de seu modelo OmniParser para sistemas operacionais Windows, o OmniParser-v2.0. Este modelo pode identificar e interagir com elementos de desktop e janela, marcando mais um passo em direção à capacidade dos agentes de IA de usar computadores de forma totalmente automática. A capacidade fundamental do OmniParser-v2.0 reside em sua capacidade de percepção e interação com o ambiente de desktop. Isso significa que, ao ser combinado com este modelo, o agente de IA

Feb 17, 2025

13.0k