zh
红薯智语
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
红薯智语
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-08-26 11:34:35
.
AIbase
.
11.3k
南洋理工大学出品!视频修复框架KEEP:修复视频中的人脸清晰度 高清不再模糊
面对视频质量对观看体验的直接影响,特别是面部细节的呈现,当前方法如简单应用超分辨率网络于面部数据集或独立处理每帧图像,往往难以兼顾面部重建的细节与时间一致性。为解决这一挑战,南洋理工大学研究团队推出了创新框架KEEP,利用卡尔曼滤波原理实现面部修复的“回忆”能力,显著提升修复过程中的面部细节一致性和连续性。KEEP框架由四个关键模块组成:编码器、解码器、卡尔曼滤波网络和跨帧注意力(CFA),构建基于变分量子生成对抗网络(VQGAN)的模型用于生成高清面部图像。卡尔曼滤波网络通过结合当前帧和前一帧的信息,形成准确的状态估计,增强图像清晰度。跨帧注意力模块进一步增强帧间关联性,确保视频播放的时效性和细节呈现。实验验证,KEEP在面部细节恢复和时间一致性保持方面表现出色,为面部视频超分辨率领域带来革新,显著提升观看体验。
2024-08-22 17:39:25
.
AIbase
.
11.2k
北大联手打造图像检索革命:草图、艺术画、低分辨率一网打尽!
北京大学袁粒课题组与南洋理工大学、清华自动化所研究人员合作开发了一种创新的图像检索技术,旨在通过草图、艺术画甚至低分辨率图像精准匹配用户需求。这项技术的核心是“通用风格检索”方法,它能够处理多种查询风格,包括文本、草图、艺术画等组合,显著提升检索灵活性和准确性。研究团队构建了DSR和ImageNet-X数据集,为新方法提供训练和测试资源。FreestyleRet框架通过风格提取、空间构建和提示微调模块,实现了对不同风格查询向量的有效处理,实验结果显示其在DSR和ImageNet-X数据集上取得了优异性能。研究成果已公开发布,并提供开源代码和数据集,为图像检索领域的技术进步和应用开辟了新途径。
2024-01-02 11:12:19
.
AIbase
.
4.6k
南洋理工大学发布InsActor框架:指令驱动物理动画生成
["南洋理工大学团队推出InsActor框架,采用扩散式人体运动模型,以指令生成逼真物理动画。","InsActor通过扩散策略实现条件化运动规划,捕捉高级人类指令与角色动作复杂关系。","实验证明InsActor在指令驱动运动生成和航点导向任务上取得先进结果。","框架灵活性使动画可定制,展示广泛适用性,保持视觉吸引同时保持物理可行性。","研究指出InsActor在长时任务中生成有价值的物理模拟动画,成为未来指令驱动物理动画的基准。"]