A Arcee AI lançou hoje o SuperNova, um modelo de linguagem de 70 bilhões de parâmetros projetado para empresas, oferecendo implantação, capacidade avançada de seguir instruções e opções de personalização total. O modelo visa fornecer uma alternativa robusta e controlável para empresas em relação à privacidade de dados, estabilidade do modelo e personalização, abordando problemas cruciais de serviços baseados em APIs, como OpenAI e Anthropic.

image.png

Em um cenário de IA dominado por APIs em nuvem, a Arcee AI adota uma abordagem diferente com o SuperNova. Este grande modelo de linguagem (LLM) pode ser implantado e personalizado na própria infraestrutura da empresa. Lançado hoje, o SuperNova é baseado na arquitetura Llama-3.1-70B-Instruct do Meta e utiliza um processo de pós-treinamento inovador que, segundo a Arcee, resulta em uma capacidade superior de seguir instruções e adaptação às necessidades específicas do negócio.

Inovação Tecnológica

O desenvolvimento do SuperNova envolveu múltiplos métodos de pós-treinamento.

O engenheiro-chefe do projeto, Lucas Atkins, revelou o segredo: "Treinamos três modelos: um destilado da essência do Llama405B, outro alimentado com o conjunto de dados gerado pelo nosso EvolKit e um terceiro profundamente modificado com DPO no Llama3instruct. Finalmente, combinamos esses três modelos usando uma nova magia, mantendo os superpoderes de cada um."

A Arcee afirma que isso resultou na capacidade de seguir instruções do SuperNova, especialmente a destilação do modelo de 405B parâmetros, demonstrando a capacidade do SuperNova de capturar a essência de modelos maiores, mantendo ao mesmo tempo uma implantação de hardware moderada.

Implantação e Personalização Empresarial

O SuperNova destina-se à implantação no próprio ambiente em nuvem da empresa, estando inicialmente disponível no AWS Marketplace. A Arcee também está trabalhando para disponibilizá-lo nos marketplaces do Google e Azure.

O cofundador da Arcee AI, Mark McQuade, destaca os benefícios dessa abordagem de implantação: "O modelo é implantado no seu VPC da AWS, mas também inicia um servidor web, uma interface de bate-papo e um banco de dados para armazenar o histórico de seus bate-papos. Cada pessoa na organização pode interagir diretamente com ele."

Essa abordagem de implantação aborda as preocupações das empresas com a privacidade de dados e a estabilidade do modelo. Ao contrário dos serviços baseados em APIs que podem mudar sem aviso prévio, o SuperNova oferece controle total à empresa. McQuade destaca que isso é particularmente importante dada a recente turbulência na indústria de IA: "O OpenAI acabou de abandonar o 3.5... muitas empresas construíram seus negócios em torno da API do 3.5. Então, quando a API muda, seu aplicativo para de funcionar. No nosso mundo, nada muda a menos que você queira, porque é seu modelo, sua maneira de executá-lo."

Personalização e Melhoria Contínua

Um dos principais atrativos do SuperNova é sua capacidade de ser ajustado e treinado novamente no ambiente da empresa.

Atkins explica o processo e seus benefícios: "Com o tempo, podemos treinar novamente o modelo completamente no seu próprio ambiente para melhor se adequar às suas preferências. À medida que salvamos esses bate-papos, se você deseja que o modelo melhore completamente de acordo com as preferências exclusivas da sua empresa, temos a capacidade de fazer isso sem que os dados deixem seu sistema."

Essa capacidade permite que as equipes técnicas adaptem o modelo ao conhecimento de um domínio específico ou aos requisitos específicos da empresa. Isso representa uma grande vantagem em comparação com os serviços baseados em APIs em nuvem, que geralmente não permitem esse nível de personalização.

Componentes de Código Aberto

Embora o modelo completo de 70B não seja de código aberto, a Arcee está lançando vários componentes para a comunidade de desenvolvedores:

API gratuita para teste e avaliação: Isso permite que os desenvolvedores experimentem o SuperNova sem se comprometer com uma implantação completa.

SuperNova-Lite: um modelo de código aberto com 8B de parâmetros. Este modelo menor pode ser útil para desenvolvedores que trabalham em ambientes com recursos limitados ou aqueles que desejam entender a arquitetura antes de implantar o modelo completo.

EvolKit: seu pipeline de geração de conjuntos de dados para criar pares complexos de perguntas e respostas. Essa ferramenta pode ser valiosa para organizações que desejam criar dados de treinamento personalizados para seus casos de uso específicos.

Ao disponibilizar esses componentes como código aberto, a Arcee contribui para a comunidade de IA mais ampla e, ao mesmo tempo, fornece ferramentas para clientes em potencial avaliarem e personalizarem seu produto. O Arcee SuperNova também está disponível no AWS Marketplace.

Declarações de Desempenho e Benchmarks

A Arcee afirma que o SuperNova apresenta bom desempenho em várias áreas, especialmente no raciocínio matemático. "Atkins observa: "Este se destaca em benchmarks matemáticos." No entanto, a empresa incentiva avaliações de terceiros para validar suas declarações.

"Nós forneceremos uma API para as pessoas usarem. Se houver terceiros que desejarem executar benchmarks confiáveis para avaliar por si mesmos, podemos providenciar o acesso aos pesos. Queremos ter total transparência com este modelo", diz Atkins.

Essa abertura a avaliações de terceiros é louvável, pois permite a verificação independente das declarações da Arcee. Será particularmente interessante ver como o desempenho do SuperNova em benchmarks padrão se compara aos modelos de empresas líderes de IA, como OpenAI e Anthropic.

image.png

image.png

Impacto na Estratégia de IA Empresarial

O lançamento do SuperNova ocorre em um momento em que muitas empresas estão reavaliando suas estratégias de IA. Embora os serviços de API baseados em nuvem tenham dominado o setor, o interesse em modelos implantáveis e personalizáveis que oferecem maior controle e flexibilidade está crescendo.

A abordagem do SuperNova aborda vários problemas importantes:

  • Privacidade de dados: ao ser implantado na própria infraestrutura da empresa, o SuperNova garante que os dados sensíveis nunca deixem o controle da organização.
  • Estabilidade do modelo: ao contrário dos serviços de API que podem ser alterados ou descontinuados sem aviso prévio, o SuperNova fornece uma base estável que só muda quando a organização escolhe atualizá-lo.
  • Personalização: a capacidade de ajustar e treinar novamente o modelo em dados específicos da empresa permite um nível de personalização que a maioria dos serviços de API não consegue alcançar.
  • Controle de custos: embora a implantação inicial possa exigir recursos significativos, o custo de longo prazo para executar o SuperNova pode ser menor do que o custo de pagamentos em larga escala para chamadas de API.
  • Vantagem competitiva: um modelo de IA personalizado e em constante melhoria pode fornecer uma vantagem competitiva significativa em setores onde insights impulsionados por IA são cruciais.

O Dilema da Soberania da IA

À medida que as empresas navegam pelo setor de IA em rápida evolução, o lançamento do SuperNova destaca uma tensão crescente no setor: a compensação entre a conveniência e a capacidade dos serviços de IA baseados em nuvem e o controle e a personalização oferecidos pelos modelos implantáveis. Essa dicotomia apresenta o que poderíamos chamar de "dilema da soberania da IA".

Por um lado, os serviços de API baseados em nuvem, como GPT-4 e Claude, oferecem desempenho de ponta e atualizações contínuas, mas ao custo de problemas de privacidade de dados e personalização limitada. Por outro lado, modelos como o SuperNova prometem controle e personalização total, mas exigem conhecimento interno para implantação e manutenção.

A abordagem da Arcee com o SuperNova tenta preencher essa lacuna, fornecendo um modelo que pode ser implantado localmente, ao mesmo tempo em que oferece recursos projetados para competir com os principais serviços baseados em nuvem. Essa abordagem híbrida pode ser particularmente atraente para setores com requisitos regulatórios rigorosos ou aqueles que lidam com dados altamente sensíveis.

Blog oficial: https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/