zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-10-31 13:27:57
.
AIbase
.
12.9k
字节跳动推出AI模型社区平台:炉米Lumi 类似Liblib和CIvitai
10 月 31 日讯 字节跳动悄然上线了一款名为"炉米Lumi"的AI模型分享社区平台。据悉,该平台将提供模型上传分享、Workflow搭建以及LoRA训练等功能,目前仍处于内测阶段,仅向白名单用户开放。
2024-10-29 13:53:42
.
AIbase
.
12.8k
爱诗科技视频生成大模型PixVerse V3上线 支持口型匹配、故事续写等能力
北京爱诗科技有限公司宣布,其最新版本的视频生成大模型PixVerse V3已全球同步公开上线。该版本在底层模型能力上实现了显著提升,提供了包括创意模板、口型匹配、故事续写和风格转换在内的多模态生成能力和丰富的AI玩法。
2024-08-15 16:59:04
.
AIbase
.
11.1k
颠覆传统!Lumina-mGPT 可以从文本中创建逼真且高分辨率的图像
多模态生成模型正引领人工智能新潮流,专注于融合视觉与文本数据,以创造多功能AI系统,执行从图像生成到跨数据类型理解与推理的多种任务。其中,关键挑战是提升自回归(AR)模型能力,使其能根据文本描述生成高细节图像。尽管扩散模型在生成高质量图像方面表现出色,AR模型在图像质量、分辨率灵活性及多任务处理能力上相对滞后。上海AI实验室和香港中文大学的研究人员推出Lumina-mGPT,一种基于解码器-only的变换器架构,采用多模态生成预训练方法,旨在克服AR模型限制,实现与扩散模型同等水平的逼真图像生成,同时保持简便性和可扩展性。Lumina-mGPT采用详尽的灵活渐进的监督微调策略,增强图像生成能力,支持高分辨率图像生成(1024×1024像素),细节丰富且与文本提示高度一致。该模型在图像质量、视觉一致性及多种任务支持方面超越前代模型,仅需较小数据集即可实现卓越性能,预示未来AI系统将更加复杂与多才多艺。
2023-11-03 09:35:33
.
AIbase
.
2.8k
加州大学圣克鲁斯分校研发开源多模态模型 MiniGPT-5
["加州大学圣克鲁斯分校研发 MiniGPT-5 模型,实现了文本和图像的有效对齐。","MiniGPT-5 采用了多模态编码器和 Generative Vokens 技术,生成连贯、高质量的文本和图像。","模型在多个数据集上的测试中表现优于对比基线,展现出强大的适应能力。"]