Em 8 de abril de 2025, a NVIDIA anunciou seu mais recente modelo de linguagem grande (LLM) - Llama3.1Nemotron Ultra253B. Este modelo, baseado no Llama-3.1-405B-Instruct da Meta, foi profundamente otimizado através da inovadora tecnologia de busca de arquitetura neural (NAS). Ele não apenas superou os modelos Behemoth e Maverick da recente série Llama4, mas também foi lançado como código aberto na plataforma Hugging Face, gerando grande interesse na comunidade de IA.

QQ_1744161895807.png

Desempenho inovador: superando Llama4 Behemoth e Maverick

De acordo com informações divulgadas pela NVIDIA e discussões recentes nas redes sociais, o Llama3.1Nemotron Ultra253B apresentou excelente desempenho em diversos benchmarks importantes. Com 253 bilhões de parâmetros, em comparação com os 2 trilhões de parâmetros totais do Llama4 Behemoth (288 bilhões de parâmetros ativos) e os 17 bilhões de parâmetros ativos do Maverick, o Nemotron Ultra alcançou um avanço significativo no equilíbrio entre eficiência e desempenho.

Embora os dados de benchmark específicos ainda não tenham sido totalmente divulgados, o Nemotron Ultra supostamente superou os modelos principais da série Llama4 em capacidade de raciocínio, obediência a instruções e processamento de tarefas gerais. Isso se deve à otimização da arquitetura do modelo pela NVIDIA através da tecnologia NAS, reduzindo significativamente o consumo de memória e a latência de inferência, mantendo ao mesmo tempo alta precisão. Em contraste, o Llama4 Behemoth, apesar de sua grande quantidade de parâmetros, exige recursos computacionais mais exigentes, enquanto o Nemotron Ultra pode ser executado eficientemente em um único nó com 8 GPUs H100, demonstrando sua vantagem em termos de praticidade.

Lançamento de código aberto: modelo amigável para negócios no Hugging Face

O Llama3.1Nemotron Ultra253B não apenas possui um desempenho robusto, mas sua estratégia de código aberto também é elogiada. O modelo está disponível na plataforma Hugging Face com pesos abertos, seguindo a Licença de Modelo Aberto da NVIDIA e o acordo de licença da comunidade Llama3.1, permitindo o uso comercial.

Afirma-se que o Nemotron Ultra253B não apenas derrotou o Llama4 Behemoth e o Maverick, mas também se compara ao DeepSeek R1, e possui licença comercial, o que é extremamente popular! Essa iniciativa é considerada um passo importante da NVIDIA para promover a democratização da IA, oferecendo aos desenvolvedores, empresas e pesquisadores acesso conveniente a modelos de alto desempenho.

Além disso, o modelo suporta comprimento de contexto de até 128K, adequado para várias tarefas, como raciocínio avançado, interação de bate-papo, geração aprimorada por recuperação (RAG) e chamadas de ferramentas. A NVIDIA destaca que os desenvolvedores podem alternar o "modo de raciocínio" (Reasoning On/Off) por meio de prompts do sistema, adaptando-se às necessidades de diferentes cenários de aplicação.

É importante notar que o Llama4 Behemoth ainda não foi totalmente lançado (atualmente está em fase de treinamento), portanto, uma comparação direta pode não ser completa. No entanto, o Nemotron Ultra, com sua natureza de código aberto e sua adaptação eficiente a clusters de GPU única, é considerado um cavalo escuro no campo da IA atual.

QQ_1744161906170.png

O posicionamento estratégico da NVIDIA

Analistas do setor afirmam que o lançamento do Llama3.1Nemotron Ultra253B não é apenas um avanço tecnológico, mas também um posicionamento estratégico da NVIDIA no ecossistema de IA. Ao otimizar modelos de código aberto existentes e melhorar seu desempenho, a NVIDIA não apenas demonstra sua força no desenvolvimento de software de IA, mas também consolida ainda mais a posição central de seu hardware (especialmente a GPU H100) na inferência e treinamento de IA. A vantagem de eficiência deste modelo significa que as empresas podem implantar soluções de IA de alto desempenho a um custo menor, o que certamente impulsionará a demanda de mercado pelo hardware da NVIDIA.

A apresentação do Llama3.1Nemotron Ultra253B marca mais um grande avanço da NVIDIA na área de modelos de linguagem grandes. Seu desempenho superior ao Llama4 Behemoth e Maverick, aliado às características de código aberto e amigável para negócios, o torna um destaque na área de IA em 2025.

Acesso ao projeto: https://top.aibase.com/tool/llama-3-1-nemotron-ultra-253b