DataDreamer是一个强大的开源Python库,用于提示、生成合成数据和训练工作流。它旨在简单易用,极其高效,且具有研究级质量。DataDreamer支持创建提示工作流、生成合成数据集、对齐模型、微调模型、指令调优模型和模型蒸馏。它具有简单、研究级、高效、可复现的特点,并简化了数据集和模型的共享。