Modelo Llama de IA de código aberto da Groq lidera o ranking, superando GPT-4 e Claude em chamadas de função

A empresa de hardware de IA Groq lançou dois modelos de linguagem de código aberto que superam as grandes empresas de tecnologia em capacidade de uso de ferramentas especializadas. O novo modelo Llama-3-Groq-70B-Tool-Use conquistou o primeiro lugar no ranking de chamadas de função de Berkeley (BFCL), superando produtos proprietários da OpenAI, Google e Anthropic.

Rick Lamers, líder de projeto da Groq, anunciou este avanço em um post no X.com. Ele disse: "Estou orgulhoso em anunciar os modelos Llama3Groq Tool Use 8B e 70B. Esta é uma versão totalmente ajustada de uso de ferramentas de código aberto do Llama3, que alcançou o primeiro lugar no BFCL, superando todos os outros modelos, incluindo modelos proprietários como Claude Sonnet 3.5, GPT-4 Turbo, GPT-4o e Gemini 1.5 Pro."

Dados sintéticos e IA ética: um novo paradigma no treinamento de modelos

A versão maior de 70B parâmetros atingiu uma precisão geral de 90,76% no BFCL, enquanto o modelo menor de 8B obteve uma pontuação de 89,06%, ficando em terceiro lugar geral. Esses resultados demonstram que os modelos de código aberto podem igualar ou até mesmo superar o desempenho de alternativas de código fechado em tarefas específicas.

A Groq colaborou com a empresa de pesquisa de IA Glaive para desenvolver esses modelos, usando ajuste fino completo e otimização de preferência direta (DPO) no modelo base Llama-3 do Meta. A equipe destaca que eles usaram apenas dados sintéticos gerados eticamente para treinamento, abordando preocupações comuns sobre privacidade de dados e sobreajuste.

Esses modelos agora estão disponíveis por meio da API Groq e da plataforma Hugging Face. Essa acessibilidade pode acelerar a inovação em áreas que exigem uso de ferramentas complexas e chamadas de função, como codificação automática, análise de dados e assistentes de IA interativos.

A Groq também lançou uma demonstração pública no Hugging Face Spaces, permitindo que os usuários interajam com os modelos e testem em primeira mão sua capacidade de uso de ferramentas. Assim como o Gradio, adquirido pelo Hugging Face em dezembro de 2021, muitas demonstrações no Hugging Face Spaces são criadas dessa maneira. A comunidade de IA respondeu positivamente, com muitos pesquisadores e desenvolvedores ansiosos para explorar as capacidades desses modelos.

Destaques:
⭐ Os modelos de IA de código aberto lançados pela Groq superaram os modelos proprietários das grandes empresas de tecnologia em tarefas específicas.
⭐ Ao treinar com dados sintéticos, a Groq desafia os problemas comuns de privacidade de dados e sobreajuste no desenvolvimento de modelos de IA.
⭐ O lançamento de modelos de código aberto pode mudar o curso do desenvolvimento da IA, promovendo uma acessibilidade mais ampla da IA e o cultivo de um ecossistema de inovação.

Notícias e Informações de IA

Modelo Llama de IA de código aberto da Groq lidera o ranking, superando GPT-4 e Claude em chamadas de função

AIbase基地