A OpenAI anunciou hoje que seu novo modelo principal, o GPT-4o mini, está disponível no Azure AI, com suporte para processamento de texto, e recursos de imagem, áudio e vídeo serão lançados posteriormente.

image.png

O GPT-4o mini é significativamente mais inteligente que o GPT-3.5 Turbo — obtendo uma pontuação de 82% na medida de compreensão de linguagem de múltiplas tarefas em larga escala (MMLU), enquanto o GPT-3.5 Turbo obteve 70% — e é mais de 60% mais barato.1 O modelo oferece uma janela de contexto expandida de 128K e integra os recursos multilínguas aprimorados do GPT-4o. O Azure OpenAI Studio Playground permite experimentar o GPT-4o mini gratuitamente.

O Microsoft Azure AI fornece segurança padrão para o GPT-4o mini, além de atualizações na residência de dados expandida e na disponibilidade do serviço. Os clientes podem esperar um desempenho e recursos aprimorados no Azure AI, especialmente em cenários de streaming, como assistentes, interpretadores de código e recuperação.

O Azure AI anunciou a implantação global sob demanda e com limite de alta taxa de transferência para o GPT-4o mini. Agora, os clientes podem pagar de forma flexível pelos recursos consumidos, enquanto o tráfego será roteado globalmente para fornecer maior taxa de transferência, com controle estático da localização de armazenamento de dados. A opção de implantação global sob demanda oferecerá uma taxa de transferência de 15 milhões de tokens por minuto (TPM), fornecendo 99,99% de disponibilidade para o GPT-4o mini, com a mesma velocidade da indústria da OpenAI.

O GPT-4o mini estará disponível no Azure AI este mês e será oferecido no serviço Batch. O Batch entrega trabalhos de alta taxa de transferência em 24 horas com um desconto de 50% usando capacidade fora do horário de pico. Isso só é possível porque a Microsoft executa no Azure AI, permitindo que a Microsoft Azure AI ofereça capacidade fora do horário de pico aos clientes.

A Microsoft Azure AI também lançará este mês recursos de ajuste fino para o GPT-4o mini, permitindo que os clientes personalizem ainda mais o modelo de acordo com casos de uso e cenários específicos. Após a atualização do mês passado para cobrança de treinamento baseada em tokens, a Microsoft Azure AI reduziu as taxas de hospedagem em 43%. Junto com seu preço de inferência baixo, isso torna a implantação de ajuste fino do serviço Azure OpenAI o produto mais econômico para clientes com cargas de trabalho de produção.

Destaques do plano:

⭐ GPT-4o mini chega ao Azure AI, com suporte para processamento de texto, velocidade excepcional e recursos completos

⭐ O novo modelo é mais inteligente que seu antecessor, 60% mais barato, oferece uma janela de contexto mais ampla e recursos multilínguas

⭐ O Azure AI oferece uma opção de implantação global sob demanda para o GPT-4o mini, com alta taxa de transferência e 99,99% de disponibilidade