O modelo o3AI, recentemente lançado pela OpenAI, é considerado seu produto de inteligência artificial mais poderoso, mas seu custo operacional é exorbitante, com uma taxa de mais de US$ 1.000 por tarefa.
De acordo com a TechCrunch, este novo modelo emprega uma técnica chamada "cálculo em tempo de teste" ao lidar com problemas complexos, o que significa que ele gasta mais tempo pensando e explorando várias possibilidades antes de chegar a uma resposta. Portanto, os engenheiros da OpenAI esperam que o o3 gere respostas de melhor qualidade em prompts complexos.
Segundo François Chollet, criador do benchmark ARC-AGI, o o3 atingiu uma pontuação de 87,5% em seu poderoso "modo de alto cálculo", quase o triplo da pontuação de 32% do modelo o1 de geração anterior. Isso indica uma melhoria significativa no desempenho do o3. No entanto, esse processo de cálculo refinado vem com um custo enorme. Para atingir essa alta pontuação, o custo computacional do o3 ultrapassou US$ 1.000 por tarefa, usando 170 vezes mais capacidade computacional do que a versão de baixo consumo do o3, muito mais do que seu antecessor, que custava menos de US$ 4 por tarefa.
Essa situação gerou preocupação na indústria sobre a contradição entre o desempenho do modelo o3 e seu custo operacional. Por um lado, a grande melhoria na pontuação do o3 parece comprovar que os modelos de IA ainda podem progredir através da "escalabilidade", ou seja, aumentando a capacidade de processamento e os dados de treinamento. Por outro lado, as críticas sobre os retornos decrescentes da escalabilidade estão aumentando. Embora a melhoria do o3 seja principalmente devido à melhoria de sua maneira de "raciocinar", e não simplesmente à escalabilidade, seu alto custo operacional é, sem dúvida, preocupante.
Mesmo a versão de baixo consumo do o3 atingiu uma pontuação de 76% no benchmark, mas o custo por tarefa foi de cerca de US$ 20, ainda uma opção relativamente barata, embora várias vezes mais cara que seu antecessor. Além disso, considerando que o ChatGPT Plus custa apenas US$ 25 por mês, isso coloca a OpenAI sob enorme pressão de custo para melhorar o nível de inteligência usado pelos usuários.
Em um post de blog sobre os resultados do benchmark, Chollet apontou que, embora o o3 esteja se aproximando do desempenho humano, "o custo ainda é muito alto e não é econômico". Ele disse que o custo de mão de obra para resolver tarefas ARC-AGI é de cerca de US$ 5 por tarefa, enquanto o consumo de energia é apenas alguns centavos. No entanto, ele expressou otimismo de que "a relação custo-benefício pode melhorar significativamente nos próximos meses e anos". Atualmente, o o3 ainda não foi lançado ao público, e espera-se que sua "mini versão" seja lançada em janeiro do próximo ano.
Destaques:
🌟 O custo de uma única consulta do modelo o3AI ultrapassa US$ 1.000, mostrando seu alto custo operacional.
📊 No benchmark ARC-AGI, o o3 atingiu uma pontuação de 87,5%, quase o triplo da geração anterior, o modelo o1.
🔍 Atualmente, o o3 ainda não foi lançado ao público, e espera-se que sua "mini versão" seja lançada em janeiro do próximo ano.