快手开源图像生成模型可图Kolors 支持在画面中生成文字

快手今天放了个大招，开源了自家的图像生成模型——"可图 Kolors"。这可不是一个普通的模型，它在数十亿的文本图像对上进行了训练，搭载了通用语言模型（GLM）作为文本编码器，支持中英文双语提示词，还能处理长达256个token的上下文。

可图 Kolors 特色一览:

AIbase测试一下，发现，目前可图在图片中插入中文表现会更好，基本都可以正确输出，但英文的话，容易少字或错字。

QQ截图20240708112714.jpg

QQ截图20240708111705.jpg

可以看到，上面生成的躺平小猫，中文完全没问题，但我换成“AIbase”就会有缺字漏字的情况。就输出中文而言，可图表现可圈可点，不过注意，文字不能太长，太长的话，容易出错。

QQ截图20240708112728.jpg

这个模型不仅仅是一个简单的工具，它背后有快手强大的技术支撑。它在海量数据上训练，对中国文化元素有特别优化，生成的图像更有中国味。这不仅仅是技术上的突破，更是文化上的传承。

开源计划还包括了CN（ControlNet）支持、LoRa(低秩适应)、IPA(图像提示适应)和ComfyUI直接支持，这些都是为了让你的创作过程更加流畅和个性化。

技术细节:

快手这次开源"可图 Kolors"，不仅是对技术社区的贡献，更是对创作自由的一次大胆推动。这表明了快手在AI技术上的决心和实力，也让我们看到了AI在艺术创作上的无限可能。

可图官网:https://top.aibase.com/tool/kuaishouketudamoxingkolors

项目地址:https://top.aibase.com/tool/kolors

AI新闻资讯