Notícias de IA

Não perca nenhum momento da inovação global em IA

IA Diário

Tendências diárias da indústria de IA em três minutos

Linha do Tempo da IA

Marcos da indústria de IA

Al hardware

lista todos os produtos de hardware AI.

Guia de Monetização de IA

Casos Recentes

Compartilhamento de casos de monetização de IA

Coleção de Imagens

Casos de monetização de criação de imagens por IA

Coleção de Vídeos

Casos de monetização de criação de vídeos por IA

Coleção de Áudios

Casos de monetização de criação de áudios por IA

Coleção de Conteúdo

Casos de monetização de escrita de conteúdo por IA

Tutoriais de IA

Tutoriais Recentes

Compartilhamento gratuito dos tutoriais de IA mais recentes

Rankings de Produtos de IA

Ranking de Produtos de IA

Mostra o ranking total de visitas de sites de IA

Ranking de Crescimento de Tráfego de IA

Rastreia os sites de IA de crescimento mais rápido por tráfego

Ranking de Queda de Tráfego de IA

Foco em sites de IA com quedas significativas de tráfego

Ranking Semanal de IA

Mostra o ranking semanal de visitas de sites de IA

Rankings de Países Populares

Estados Unidos

Sites de IA mais populares entre os usuários dos EUA

China

Sites de IA mais populares entre os usuários chineses

Índia

Sites de IA mais populares entre os usuários indianos

Brasil

Sites de IA mais populares entre os usuários brasileiros

Rankings de Categorias Populares

Geração de Imagens

Ranking total de visitas de sites de geração de imagens de IA

Assistente Pessoal

Ranking total de visitas de sites de assistentes pessoais de IA

Geração de Personagens

Ranking total de visitas de sites de geração de personagens de IA

Geração de Vídeos

Ranking total de visitas de sites de geração de vídeos de IA

Rankings de Dados de Código Aberto Populares

Ranking de Projetos de IA

Projetos de IA populares no GitHub por total de estrelas

Ranking de Crescimento de Projetos de IA

Projetos de IA populares no GitHub por taxa de crescimento

Ranking de Desenvolvedores de IA

Ranking de desenvolvedores de IA populares no GitHub

Ranking de Organizações de IA

Ranking de organizações de IA populares no GitHub

Categorias de Código Aberto Populares

Deepseek

Projetos de código aberto Deepseek populares no GitHub

TTS

Projetos de código aberto TTS populares no GitHub

LLM

Projetos de código aberto LLM populares no GitHub

ChatGPT

Projetos de código aberto ChatGPT populares no GitHub

Biblioteca de Projetos de Código Aberto de IA

Visão Geral

Visão geral dos projetos de código aberto de IA populares no GitHub

Biblioteca de produtos Navegação de ferramentas

Nvidia lança o Llama 3.1 Nemotron Ultra 253B, superando o Llama 4 Behemoth em desempenho

AIbase基地

Publicado emNotícias e Informações de IA · 7 minutos de leitura · Apr 9, 2025

Em 8 de abril de 2025, a NVIDIA anunciou seu mais recente modelo de linguagem grande (LLM) - Llama3.1Nemotron Ultra253B. Este modelo, baseado no Llama-3.1-405B-Instruct da Meta, foi profundamente otimizado através da inovadora tecnologia de busca de arquitetura neural (NAS). Ele não apenas superou os modelos Behemoth e Maverick da recente série Llama4, mas também foi lançado como código aberto na plataforma Hugging Face, gerando grande interesse na comunidade de IA.

Desempenho inovador: superando Llama4 Behemoth e Maverick

De acordo com informações divulgadas pela NVIDIA e discussões recentes nas redes sociais, o Llama3.1Nemotron Ultra253B apresentou excelente desempenho em diversos benchmarks importantes. Com 253 bilhões de parâmetros, em comparação com os 2 trilhões de parâmetros totais do Llama4 Behemoth (288 bilhões de parâmetros ativos) e os 17 bilhões de parâmetros ativos do Maverick, o Nemotron Ultra alcançou um avanço significativo no equilíbrio entre eficiência e desempenho.

Embora os dados de benchmark específicos ainda não tenham sido totalmente divulgados, o Nemotron Ultra supostamente superou os modelos principais da série Llama4 em capacidade de raciocínio, obediência a instruções e processamento de tarefas gerais. Isso se deve à otimização da arquitetura do modelo pela NVIDIA através da tecnologia NAS, reduzindo significativamente o consumo de memória e a latência de inferência, mantendo ao mesmo tempo alta precisão. Em contraste, o Llama4 Behemoth, apesar de sua grande quantidade de parâmetros, exige recursos computacionais mais exigentes, enquanto o Nemotron Ultra pode ser executado eficientemente em um único nó com 8 GPUs H100, demonstrando sua vantagem em termos de praticidade.

Lançamento de código aberto: modelo amigável para negócios no Hugging Face

O Llama3.1Nemotron Ultra253B não apenas possui um desempenho robusto, mas sua estratégia de código aberto também é elogiada. O modelo está disponível na plataforma Hugging Face com pesos abertos, seguindo a Licença de Modelo Aberto da NVIDIA e o acordo de licença da comunidade Llama3.1, permitindo o uso comercial.

Afirma-se que o Nemotron Ultra253B não apenas derrotou o Llama4 Behemoth e o Maverick, mas também se compara ao DeepSeek R1, e possui licença comercial, o que é extremamente popular! Essa iniciativa é considerada um passo importante da NVIDIA para promover a democratização da IA, oferecendo aos desenvolvedores, empresas e pesquisadores acesso conveniente a modelos de alto desempenho.

Além disso, o modelo suporta comprimento de contexto de até 128K, adequado para várias tarefas, como raciocínio avançado, interação de bate-papo, geração aprimorada por recuperação (RAG) e chamadas de ferramentas. A NVIDIA destaca que os desenvolvedores podem alternar o "modo de raciocínio" (Reasoning On/Off) por meio de prompts do sistema, adaptando-se às necessidades de diferentes cenários de aplicação.

É importante notar que o Llama4 Behemoth ainda não foi totalmente lançado (atualmente está em fase de treinamento), portanto, uma comparação direta pode não ser completa. No entanto, o Nemotron Ultra, com sua natureza de código aberto e sua adaptação eficiente a clusters de GPU única, é considerado um cavalo escuro no campo da IA atual.

O posicionamento estratégico da NVIDIA

Analistas do setor afirmam que o lançamento do Llama3.1Nemotron Ultra253B não é apenas um avanço tecnológico, mas também um posicionamento estratégico da NVIDIA no ecossistema de IA. Ao otimizar modelos de código aberto existentes e melhorar seu desempenho, a NVIDIA não apenas demonstra sua força no desenvolvimento de software de IA, mas também consolida ainda mais a posição central de seu hardware (especialmente a GPU H100) na inferência e treinamento de IA. A vantagem de eficiência deste modelo significa que as empresas podem implantar soluções de IA de alto desempenho a um custo menor, o que certamente impulsionará a demanda de mercado pelo hardware da NVIDIA.

A apresentação do Llama3.1Nemotron Ultra253B marca mais um grande avanço da NVIDIA na área de modelos de linguagem grandes. Seu desempenho superior ao Llama4 Behemoth e Maverick, aliado às características de código aberto e amigável para negócios, o torna um destaque na área de IA em 2025.

Acesso ao projeto: https://top.aibase.com/tool/llama-3-1-nemotron-ultra-253b

Llama3.1NemotronUltra253B ModelodeLinguagemGrande(LLM)BuscadeArquiteturaNeural(NAS)NVIDIA

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily