GenAU是一个由Snap Research开发的音频生成模型,它通过AutoCap自动字幕生成模型和GenAu音频生成架构,显著提升了音频生成的质量。它在生成环境声音和效果方面具有挑战性,特别是在数据稀缺和字幕质量不足的情况下。GenAU模型能够生成高质量的音频,并且在音频合成领域具有很大的潜力。