Na era de rápido desenvolvimento da inteligência artificial (IA), empresas de todos os tamanhos estão se esforçando para implantar tecnologias de IA em seus ambientes de produção, buscando um retorno maior sobre o investimento. No entanto, mesmo com a disponibilidade de modelos de IA avançados, as equipes ainda enfrentam vários desafios na implantação.

image.png

De acordo com estimativas de Peter Bendor-Samuel, CEO da Everest Group, 90% dos projetos piloto de IA generativa terão dificuldades para chegar à fase de produção. Além disso, a Gartner prevê que, até o final de 2025, muitos projetos de IA generativa serão abandonados após a prova de conceito.

Entre esses desafios, a maior barreira é a orquestração. As equipes frequentemente carecem de recursos suficientes para realizar todas as tarefas, levando-as a depender de APIs de terceiros rígidas e caras. Para preencher essa lacuna, a Simplismart AI recentemente recebeu US$ 7 milhões em financiamento e lançou uma plataforma de operações de aprendizado de máquina de ponta a ponta, projetada para acelerar todo o processo de orquestração, desde o ajuste fino do modelo até a implantação e monitoramento.

Em comparação com outras soluções de operações de aprendizado de máquina no mercado, o destaque da Simplismart é seu motor de inferência de otimização de software personalizado. Esse motor pode implantar modelos em velocidade extremamente alta, melhorando significativamente o desempenho e reduzindo os custos associados. Amitanshu Jain, cofundador da Simplismart, afirma que, sem nenhuma otimização de hardware, o modelo Llama3.18B atingiu uma taxa de transferência de 501 tokens por segundo, superando outros motores de inferência.

Ao implantar IA internamente, as equipes precisam enfrentar vários gargalos, incluindo a aquisição de capacidade computacional, a otimização do desempenho do modelo, a expansão da infraestrutura e a eficiência de custos. A plataforma da Simplismart padroniza todo o fluxo de trabalho, permitindo que os usuários ajustam, implantem e observem modelos de código aberto altamente otimizados, conforme necessário.

Os usuários podem optar por usar a infraestrutura compartilhada da Simplismart ou trazer seus próprios recursos computacionais, permitindo a configuração e implantação convenientes de sua própria infraestrutura. Além disso, o painel intuitivo da plataforma permite que os usuários configurem parâmetros como GPU, tipo de máquina e escala. A plataforma também fornece recursos de monitoramento, permitindo que os usuários rastreiem os acordos de nível de serviço (SLAs) e monitorem o desempenho real do modelo.

Atualmente, a Simplismart já estabeleceu parcerias com 30 clientes corporativos e planeja melhorar ainda mais o desempenho de sua plataforma de operações de aprendizado de máquina. A empresa espera usar a nova rodada de financiamento para impulsionar a pesquisa e o desenvolvimento, aumentar a velocidade de inferência de IA e buscar um crescimento de receita anual de aproximadamente US$ 1 milhão para US$ 10 milhões nos próximos 15 meses.

Destaques:

💡 90% dos projetos piloto de IA generativa terão dificuldades para chegar à fase de produção, sendo a orquestração a maior barreira.   

🚀 O motor de inferência personalizado da Simplismart atingiu uma taxa de transferência de 501 tokens por segundo sem otimização de hardware.   

📈 A empresa já estabeleceu parcerias com 30 clientes corporativos e tem como objetivo aumentar sua receita anual para US$ 10 milhões em 15 meses.