zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-11-12 14:52:11
.
AIbase
.
13.2k
无需顶级显卡,Meissonic 让你轻松生成媲美 SDXL 的高清大图!
Stable Diffusion 等模型的出现标志着图像生成领域取得了重大进展,但其与自回归语言模型的根本区别,阻碍了统一的语言视觉模型的开发。为解决这一问题,研究人员推出了 Meissonic,它将非自回归掩码图像建模 (MIM) 文本到图像技术提升到了与 SDXL 等最先进的扩散模型相媲美的水平。Meissonic 的核心在于一系列架构创新、先进的位置编码策略以及优化的采样条件,这些改进显著提高了 MIM 的性能和效率。此外,Meissonic 还利用了高质量的训练数据,集成了基于人类偏好分数的微条件,并采用
2024-07-03 08:16:26
.
AIbase
.
10.0k
MimicMotion:实现高质量的人体运动视频生成
随着人工智能图像生成技术的不断发展,各种应用也不断涌现。其次,基于姿态置信度的区域损失放大显著减轻了图像的扭曲。该框架采用置信度感知的姿态指导和区域损失放大等技术来提高视频的质量和稳定性,是一种有前途的视频生成框架。然而,视频生成方面仍然面临许多挑战,如可控性、视频长度和细节丰富性等,这些问题阻碍了该技术的应用和普及。最后,为了生成长而平滑的视频,提出了一种渐进潜在融合策略。
2024-01-05 10:29:34
.
AIbase
.
4.7k
Hugging Face推出aMUSEd模型,几秒钟内生成图像
["Hugging Face推出的aMUSEd模型可以在几秒钟内生成图像,相比其他竞争对手如Stable Diffusion更快。","aMUSEd使用了一种轻量级的文本到图像模型,基于Google的MUSE模型。","aMUSEd采用了Masked Image Model(MIM)架构,减少了推理步骤,提高了生成速度和可解释性。","模型可在Hugging Face上的演示中进行尝试,目前以研究预览版形式提供,使用OpenRAIL许可证。","aMUSEd生成的图像质量可以进一步提高,团队选择发布它以“鼓励社区探索像MIM这样的非扩散框架用于图像生成”。"]
2023-10-30 09:10:37
.
AIbase
.
2.6k
MimicGen:合成数据助力AI模仿学习
["研究展示MimicGen系统能生成大规模机器人训练数据。","通过数字孪生技术,在模拟环境中复制人类操作数据。","仅用不到200个人类演示,自主生成5万个训练数据。","合成数据和模拟对AI发展至关重要,可获得无限训练数据。","MimicGen适用于长序列任务和高精确度任务,如抓放、组装等。"]