大規模言語モデルのパラメータ数は100倍に増加し、現在では1兆を超える規模に達しています。そのため、膨大なリソース消費に伴い、ストレージコスト、推論コスト、運用コスト、導入コストなどが大幅に増加しています。大規模言語モデル企業は現在、「コスト削減」に積極的に取り組んでいます。第一に、データの規模化による規模の経済効果の向上、第二に、性能を維持したまま、より高速な推論速度、より短い遅延、より少ないリソースで動作するモデルの圧縮、第三に、チップと計算クラスタのパフォーマンス向上、第四に、規模、機能、方向性の異なる大規模言語モデルに対する商業化アプローチの明確化です。長期的な持続可能なサービスのためには、「コスト削減」は避けて通れない道です。