Ai2 lança novo modelo de linguagem OLMo2 para competir com o Llama da Meta

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Nov 27, 2024

197

A instituição de pesquisa de IA sem fins lucrativos Ai2 lançou recentemente sua nova série OLMo2, a segunda geração de seus modelos de "linguagem aberta" (OLMo). O lançamento do OLMo2 não apenas fornece um forte suporte técnico à comunidade de IA, mas também, com seu código totalmente aberto, representa o mais recente desenvolvimento em IA de código aberto.

Diferentemente de outros modelos de linguagem "abertos" no mercado, como a série Llama do Meta, o OLMo2 atende à definição estrita da Iniciativa de Código Aberto. Isso significa que os dados de treinamento, ferramentas e códigos usados em seu desenvolvimento são públicos e acessíveis a qualquer pessoa. De acordo com a definição da Open Source Initiative, o OLMo2 atende aos padrões de "IA de código aberto" da instituição, padrões esses finalizados em outubro deste ano.

Em seu blog, a Ai2 menciona que, durante o desenvolvimento do OLMo2, todos os dados de treinamento, códigos, esquemas de treinamento, métodos de avaliação e checkpoints intermediários foram totalmente abertos. O objetivo é impulsionar a inovação e a descoberta na comunidade de código aberto por meio do compartilhamento de recursos. "Ao compartilhar abertamente nossos dados, esquemas e descobertas, esperamos fornecer à comunidade de código aberto os recursos para descobrir novos métodos e tecnologias inovadoras", disse a Ai2.

A série OLMo2 inclui duas versões: o OLMo7B com 7 bilhões de parâmetros e o OLMo13B com 13 bilhões de parâmetros. O número de parâmetros afeta diretamente o desempenho do modelo, com versões de maior número de parâmetros geralmente capazes de lidar com tarefas mais complexas. Em tarefas de texto comuns, o OLMo2 se destaca, podendo realizar tarefas como responder a perguntas, resumir documentos e escrever códigos.

Modelo grande Código Internet

Nota da fonte: A imagem foi gerada por IA, fornecida pelo Midjourney.

Para treinar o OLMo2, a Ai2 usou um conjunto de dados contendo 5 trilhões de tokens. Tokens são as menores unidades em modelos de linguagem; 1 milhão de tokens equivalem a aproximadamente 750 mil palavras. Os dados de treinamento incluem conteúdo de sites de alta qualidade, artigos acadêmicos, fóruns de perguntas e respostas e cadernos de exercícios matemáticos sintéticos. Esses dados foram cuidadosamente selecionados para garantir a eficiência e a precisão do modelo.

A Ai2 está confiante no desempenho do OLMo2, afirmando que sua performance compete com modelos de código aberto como o Llama 3.1 do Meta. A Ai2 aponta que o desempenho do OLMo2 7B até supera o Llama 3.1 8B, tornando-se um dos modelos de linguagem totalmente abertos mais poderosos atualmente. Todos os modelos OLMo2 e seus componentes podem ser baixados gratuitamente no site da Ai2 e seguem a licença Apache 2.0, o que significa que esses modelos podem ser usados não apenas para pesquisa, mas também para aplicações comerciais.

OLMo2 IA Aberta Ai2 Llama

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Boletim Diário de IA: CogView4, modelo de geração de imagens a partir de texto de código aberto que gera caracteres chineses; Vulnerabilidade grave encontrada na ferramenta de modelos grandes Ollama; Downloads do Tencent Yuanbao superam o DeepSeek

Bem-vindo ao boletim diário de IA! Aqui você encontrará seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo da IA, com foco em desenvolvedores, para ajudá-lo a entender as tendências tecnológicas e os aplicativos inovadores de produtos de IA. Descubra novos produtos de IA aqui: https://top.aibase.com/1、A Zhishu lança o CogView4, o primeiro modelo de geração de imagens a partir de texto de código aberto capaz de gerar caracteres chinesesEm 4 de março de 2025, a Beijing Zhishu Huazhang Technology Co., Ltd. lançou o CogView4...

Mar 4, 2025

Cuidado com riscos de segurança! Ferramenta de modelo grande Ollama apresenta vulnerabilidades graves

A ferramenta de modelo de linguagem grande Ollama foi identificada como tendo sérias vulnerabilidades de segurança que podem colocar em risco a privacidade dos usuários e seus dados. Especialistas recomendam cautela ao usar a plataforma até que as vulnerabilidades sejam corrigidas.

Mar 4, 2025

Boletim Diário de IA: Claude lança recursos de compartilhamento de Artifacts e remixagem; Magnific lança plugin do PS; Versão 0.2 do Ollama lançada

Bem-vindo ao boletim diário de IA! Aqui você encontra seu guia diário para explorar o mundo da inteligência artificial. Todos os dias, apresentamos os destaques do campo da IA, focando em desenvolvedores e ajudando você a entender as tendências tecnológicas e os aplicativos de produtos de IA inovadores. Descubra novos produtos de IA aqui: https://top.aibase.com/1、 Desenvolvedores independentes se alegram! Este método otimiza a eficiência e os resultados do treinamento através da seleção inteligente de lotes de dados, representando um grande avanço no campo da inteligência artificial.

Jul 10, 2024

510

智谱 AI anuncia suporte Ollama para GLM-4-9B e CodeGeeX4-ALL-9B

A ZhiPu AI lançou suporte Ollama para seus modelos de código aberto GLM-4-9B e CodeGeeX4-ALL-9B. O GLM-4-9B é um modelo multidomínio de uso geral que demonstra desempenho excepcional e está disponível abertamente. Baseado no GLM-4-9B, o CodeGeeX4-ALL-9B concentra-se na geração de código multilíngue, melhorando significativamente a capacidade de geração. O Ollama é uma ferramenta que facilita a implantação de modelos de linguagem grandes em ambientes locais, suportando Windows, macOS e Li...

Jul 12, 2024

8.4k

Ollama 0.2 Lançado: Concorrência Ativada por Padrão, Processando Múltiplos Pedidos e Carregando Múltiplos Modelos Simultaneamente

O Ollama versão 0.2 foi lançado com uma nova funcionalidade: concorrência ativada por padrão, permitindo o processamento simultâneo de múltiplos pedidos e melhorando a experiência do usuário. Esta atualização adiciona a capacidade de lidar com pedidos paralelos e o carregamento paralelo de diferentes modelos, otimizando a eficiência do processamento de tarefas e permitindo o processamento multitarefa, incluindo sessões de bate-papo, conclusão de código e processamento de documentos. Além disso, o sistema adicionou a capacidade de carregamento e descarregamento automático de modelos, ajustando-se dinamicamente com base no uso da memória da GPU para garantir operação estável e eficiente. Esta atualização torna o Ollama mais poderoso e inteligente, proporcionando uma experiência de uso de alta qualidade.

Jul 10, 2024

20.9k

Versão de visualização do Ollama para Windows lançada: ferramenta para execução de LLMs locais

O Ollama lançou sua versão de visualização para Windows, uma ferramenta de código aberto para Grandes Modelos de Linguagem focada em ambientes de execução locais. A ferramenta suporta a execução de diversos modelos, oferecendo uma interface semelhante à da OpenAI e a capacidade de carregar arquivos de modelos a quente. O lançamento da versão para Windows permite que mais usuários acessem a ferramenta, permitindo a criação personalizada de modelos. A Microsoft confirmou que a nova versão do Windows será nomeada Windows 11 24H2, com o Win10 e o Win11 ainda como versões principais. Os dados do segundo trimestre fiscal divulgados pela Microsoft mostram X

Feb 20, 2024

2.5k

Nova versão do modelo multi-modal Ollama lançada

A versão mais recente do Ollama agora suporta modelos multimodais. Basta digitar “ollama run llava” e executar. Após baixar o modelo llava-7B, basta arrastar e soltar a imagem para inserir a pergunta. Quanto maior o nível de quantização, mais preciso o modelo, mas mais lento será o tempo de execução e maior a quantidade de memória necessária. O projeto AMBER é um novo benchmark para modelos de linguagem multimodais, projetado para avaliar e reduzir problemas de alucinação nos modelos. O modelo 'Kuaiyi' de 13 bilhões e 66 bilhões de parâmetros, desenvolvido pela Kuaishou, já atingiu...

Dec 14, 2023

600

Modelo RiiidAI Sheep-duck-llama-2 lidera o ranking de modelos de linguagem grandes do Hugging Face

O mais recente modelo de IA generativo da Riiid, Sheep-duck-llama-2, alcançou a primeira posição no ranking do Hugging Face. O modelo Sheep-duck-llama-2 obteve uma pontuação alta de 74,07 após sua submissão em outubro. Este modelo, aprimorado a partir do modelo llama-2-70b, demonstra o avanço da Riiid na tecnologia de modelos de linguagem grandes.

Oct 10, 2023

2.0k

ExllamaV2: Uma biblioteca de inferência para executar LLMs localmente em GPUs de consumo modernas

O ExllamaV2 permite executar modelos de linguagem de grande escala (LLMs) localmente em GPUs de consumo comuns. Esta versão apresenta uma melhoria de desempenho de inferência de 1,5 a 2 vezes em comparação com a versão anterior. Suporta o novo formato de quantização de bits ajustáveis EXL2, permitindo controle flexível do tamanho do modelo. Integra compatibilidade com modelos HuggingFace e fornece exemplos interativos. O objetivo é ser uma solução de inferência LLM fácil de usar, reduzindo a barreira de entrada.

Sep 15, 2023

2.3k

Notícias de IA

IA Diário

Linha do Tempo da IA

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral