O tamanho dos parâmetros dos grandes modelos aumentou 100 vezes, agora ultrapassando o nível de trilhões, resultando em um consumo massivo de recursos e custos cada vez maiores de armazenamento, inferência, manutenção e implantação. As empresas de grandes modelos estão ativamente engajadas em um movimento de "redução de custos". Primeiro, a escala de dados, aumentando a eficiência marginal dos dados através de efeitos de escala; segundo, a compressão do modelo, mantendo o desempenho, mas com velocidade de inferência mais rápida, menor latência e menor demanda de recursos; terceiro, a otimização de computação, melhorando o desempenho do chip e do cluster de computação; quarto, a estratificação comercial, com diferentes modelos de grande porte, funções e direções, os caminhos de comercialização estão se tornando distintos. Controlar os gastos e otimizar os processos, para um serviço sustentável a longo prazo, a "redução de custos" dos grandes modelos é um caminho necessário.