LaVi-Bridge
连接不同语言模型和生成视觉模型进行文本到图像生成
普通产品图像文本到图像生成语言模型
LaVi-Bridge是一种针对文本到图像扩散模型设计的桥接模型,能够连接各种预训练的语言模型和生成视觉模型。它通过利用LoRA和适配器,提供了一种灵活的插拔式方法,无需修改原始语言和视觉模型的权重。该模型与各种语言模型和生成视觉模型兼容,可容纳不同的结构。在这一框架内,我们证明了通过整合更高级的模块(如更先进的语言模型或生成视觉模型)可以明显提高文本对齐或图像质量等能力。该模型经过大量评估,证实了其有效性。
LaVi-Bridge 最新流量情况
月总访问量
987
跳出率
44.36%
平均页面访问数
1.0
平均访问时长
00:00:00