2025-04-07 08:54:45.AIbase.16.9k
グーグルの新研究:合成データが、大規模言語モデルの数学的推論能力を8倍向上
最近、Google、カーネギーメロン大学、MultiOnの研究チームは、大規模言語モデルのトレーニングにおける合成データの応用に関する新たな研究を発表しました。AI開発研究機関Epoch AIの報告によると、現在、公開されている高品質なテキストトレーニングデータは約300兆トークンですが、ChatGPTなどの大規模モデルの急速な発展に伴い、トレーニングデータの需要は指数関数的に増加しており、2026年までに枯渇する可能性があると予測されています。そのため、合成データがますます重要になってきています。