Recentemente, a Inflection AI tomou uma decisão notável em sua mais recente plataforma empresarial: abandonar as GPUs da Nvidia e adotar os aceleradores Gaudi3 da Intel. Essa mudança marca um ajuste estratégico da empresa no setor de IA, considerando que seu aplicativo cliente "Pi" era baseado em GPUs da Nvidia. Agora, o Inflection3.0 dependerá do Gaudi3, permitindo que os usuários escolham entre execução local ou na nuvem Tiber AI Cloud.

Chip AI desenho (1)

Nota da fonte da imagem: Imagem gerada por IA, fornecedora de serviços de licenciamento de imagens Midjourney

A Inflection AI, fundada em 2022, inicialmente se concentrou no desenvolvimento de um assistente pessoal conversacional chamado Pi. No entanto, com a saída dos fundadores Mustafa Suleyman e Karén Simonyan na primavera para a Microsoft, a empresa passou a focar na construção de modelos personalizados para empresas, utilizando os dados dos clientes para melhorar a qualidade do serviço.

O Inflection3.0 é a versão mais recente da plataforma, com o objetivo de ajustar modelos usando conjuntos de dados proprietários para criar aplicativos de IA exclusivos para empresas. É digno de nota que a Intel será um dos primeiros clientes a usar este serviço, levando à especulação se a Inflection pagará o preço total por esses aceleradores.

Embora a Inflection planeje executar seus serviços nos aceleradores Gaudi3, a implementação completa do sistema não acontecerá tão cedo. Assim como o Inflection2.5 anterior, a versão mais recente também será executada no serviço Tiber AI Cloud da Intel. No entanto, a Inflection reconhece que alguns clientes podem desejar manter seus dados localmente, portanto, planeja oferecer sistemas físicos baseados em aceleradores de IA da Intel a partir do primeiro trimestre de 2025.

Uma das vantagens do uso dos aceleradores Gaudi3 é a significativa melhoria no desempenho em relação ao custo. O CEO da Inflection AI, Sean White, afirmou em um blog que, com a tecnologia da Intel, eles viram uma melhoria de até duas vezes no desempenho em relação ao custo em comparação com os produtos concorrentes atuais. O Gaudi3 também é considerado mais rápido e mais econômico que o H100 da Nvidia em termos de velocidade de treinamento e inferência.

As especificações técnicas do Gaudi3 também são bastante robustas, com 128 GB de memória HBM2e, largura de banda de até 3,7 Tbps e desempenho de 1.835 teraFLOPS em FP8 ou BF16 denso. Com precisão de 16 bits, o desempenho de ponto flutuante do Gaudi3 é quase o dobro do H100, o que é crucial para as cargas de trabalho de treinamento e ajuste fino em que a Inflection se concentra.

Além disso, a Intel anunciou recentemente que a IBM implantará aceleradores Gaudi3 em sua plataforma de nuvem, com lançamento previsto para o início de 2025. Isso significa que os aceleradores Gaudi3 estão gradualmente ganhando reconhecimento de mercado.

Destaques:

🌟 A Inflection AI decidiu abandonar as GPUs da Nvidia e usar os aceleradores Gaudi3 da Intel.

🚀 O Inflection3.0 será baseado no Gaudi3, oferecendo aplicativos de IA personalizados para empresas.

💰 Com o Gaudi3, a Inflection AI alcançou uma melhoria de até duas vezes no desempenho em relação ao custo.