Nemotron-CC

Transforma o Common Crawl em um conjunto de dados de pré-treinamento de longo prazo refinado

Produto ComumProgramaçãoInteligência ArtificialConjunto de Dados

O Nemotron-CC é um conjunto de dados de 6,3 trilhões de tokens baseado no Common Crawl. Ele transforma o Common Crawl em inglês em um conjunto de dados de pré-treinamento de longo prazo de 6,3 trilhões de tokens, por meio da integração de classificadores, reescrita de dados sintéticos e redução da dependência de filtros heurísticos, contendo 4,4 trilhões de tokens originais desduplicados globalmente e 1,9 trilhões de tokens gerados sinteticamente. Este conjunto de dados atinge um melhor equilíbrio entre precisão e quantidade de dados, sendo significativo para o treinamento de modelos de linguagem de grande porte.

Best AI Websites & Tools

Nemotron-CC

Nemotron-CC Situação do Tráfego Mais Recente

Nemotron-CC Tendência de Visitas

Nemotron-CC Distribuição Geográfica das Visitas

Nemotron-CC Fontes de Tráfego

Nemotron-CC Alternativas

Nemotron-CC — Transforma o Common Crawl em um conjunto de dados de pré-treinamento de longo prazo refinado

ImageInWords — Modelo para gerar descrições de imagens extremamente detalhadas, utilizado no treinamento de modelos de linguagem visual.

FineWeb — Conjunto de dados de páginas web em inglês de alta qualidade

Instella — Instella é um modelo de linguagem de código aberto de alto desempenho desenvolvido pela AMD, projetado para acelerar o desenvolvimento de modelos de linguagem de código aberto.

Clone — Clone é um robô humanoide com tecnologia de músculos artificiais revolucionária Myofiber, capaz de caminhar naturalmente.

Migician — Migician é um modelo de linguagem grande multimodal focado na localização de imagens múltiplas, capaz de realizar localização precisa de imagens múltiplas de forma livre.

IndexTTS — Sistema de texto para voz (TTS) de amostra zero, eficiente e controlável em nível industrial

tablegpt-agent — Agente pré-construído do TableGPT2 para tarefas de perguntas e respostas baseadas em tabelas.

Qwen — Qwen Chat é uma ferramenta de bate-papo de inteligência artificial baseada em um modelo de linguagem avançado, oferecendo conversas inteligentes e diversas funcionalidades.

Signs — Plataforma que utiliza inteligência artificial para auxiliar no aprendizado e na contribuição para a Língua de Sinais Americana (ASL).

kg-gen — Ferramenta de IA que extrai grafos de conhecimento de qualquer texto.

hallucination-leaderboard — Um ranking que compara a taxa de alucinação de grandes modelos de linguagem (LLMs) ao resumir documentos curtos.

Concierge IA — Interaja com seus aplicativos usando linguagem natural, melhorando sua produtividade e conveniência.

Zyphra — A Zyphra é uma empresa focada em tecnologia de inteligência artificial, oferecendo modelos de bate-papo e serviços relacionados.

RAG-FiT — RAG-FiT é uma biblioteca para aprimorar a capacidade dos LLMs de usar informações externas, ajustando finamente os modelos com um conjunto de dados RAG aprimorado especialmente criado.

Qwen2.5-Max — Qwen2.5-Max é um modelo massivo Mixture-of-Expert (MoE) dedicado a aprimorar a inteligência artificial.

SCNet DeepSeek — DeepSeek é um assistente de bate-papo inteligente que oferece serviços de conversação de IA eficientes.

Xwen-Chat — Xwen-Chat é um conjunto de modelos de linguagem grandes focados em diálogo em chinês, oferecendo diversos modelos e serviços de geração de linguagem.

Dolphin R1 — Dolphin R1 é um conjunto de dados para treinamento de modelos de raciocínio, contendo 800.000 amostras.

Tülu 3 405B — Tülu 3 405B é um modelo de linguagem de código aberto em larga escala, com desempenho aprimorado por meio de aprendizado por reforço.

SpeechGPT 2.0-prévia — O primeiro sistema de interação em tempo real de nível humano orientado para inteligência contextual, suportando interação de voz multi-emocional e multi-estilo.

Tarsier — Tarsier é um grande modelo de linguagem de vídeo lançado pela ByteDance para gerar descrições de vídeo de alta qualidade.

Baichuan-M1-14B — Modelo de linguagem extenso de código aberto desenvolvido pela Baichuan Intelligence, otimizado para cenários médicos, com capacidades gerais excepcionais e desempenho superior na área médica.

UPDF IA — O UPDF IA ajuda os usuários a resumir, traduzir, explicar, reescrever e conceituar documentos PDF, melhorando a eficiência da leitura.

WebWalker — O WebWalker é uma estrutura de benchmark para avaliar a capacidade de navegação na web de grandes modelos de linguagem.

MiniMax-01 — Modelo de linguagem poderoso com 456 bilhões de parâmetros, capaz de processar contextos de até 4 milhões de tokens.

Plataforma de Recursos de Corpus da Internet Chinesa — Oferece recursos de corpus em chinês de alta qualidade, impulsionando o pré-treinamento de grandes modelos de inteligência artificial.

Sonus-1 — Sonus-1: Inaugurando uma nova era para modelos de linguagem de grande porte (LLMs)

StoryWeaver — Modelo de mundo unificado para a personalização de personagens de histórias com aumento de conhecimento

YuLan-Mini — Modelo de linguagem leve e de alta eficiência com 240 milhões de parâmetros