全景图像生成新方法PanoFree：无需调优生成多视角图片

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Aug 8, 2024

404

在图像生成领域，尤其是全景图像的创建，利用大型预训练的文本到图像（T2I）模型进行多视角图像生成正在成为一种趋势。然而，由于获取多视角图像的成本较高，许多研究者都在寻求无需调优的生成方法。目前市面上的一些方法要么只能处理简单的对应关系，要么需要大量的微调来捕捉复杂的对应关系。

产品入口：https://top.aibase.com/tool/panofree

最近，研究者们提出了一种新方法 ——PanoFree。这是一种创新的无需调优的多视角图像生成技术，能够支持生成长图、360度图、天空盒图等多视角全景图。

生成长图:

360° 全景生成：

VR全景图：

PanoFree 通过迭代的变形和修补过程，依次生成多视角图像，解决了在生成过程中常见的一致性问题和因错误累积而导致的伪影问题，而不需要进行任何微调。

PanoFree 的方法在于提升了跨视角的意识，并通过多种技术手段来改善变形和修补过程。这些技术包括跨视角指导、风险区域的估算和擦除、以及为闭环生成而进行的对称双向引导等。

此外，PanoFree 还利用基于引导的语义和密度控制来保留场景结构。在对平面、360度和全球形全景图进行的实验中，PanoFree 展现出显著的错误减少，提升了全局一致性，并且图像质量大幅提升，且无需额外的微调。

与现有方法相比，PanoFree 在时间效率上提高了5倍，GPU 内存使用效率提升了3倍，并且在用户研究中结果的多样性也得到了2倍的提升。

总的来说，PanoFree 为那些希望降低成本、避免繁琐微调或使用额外预训练模型的研究者提供了一个可行的替代方案。

划重点:
🌟 PanoFree 是一种无需调优的多视角图像生成方法，支持复杂对应关系。
🚀 该方法通过迭代变形和修补，解决了生成中的一致性和伪影问题。
💡 PanoFree 在时间效率和内存使用上都大幅提升，并且结果多样性更高。

图像生成 T2I模型 PanoFree 多视角图像

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

月之暗面公司正式发布了其最新力作——Kimi K2模型，并同步宣布开源。这款基于MoE架构的基础模型，凭借其强大的代码能力、卓越的通用Agent任务处理能力，一经发布便在AI领域引起了广泛关注。 Kimi K2模型总参数高达1T，激活参数为32B，在SWE Bench Verified、Tau2、AceBench等一系列基准性能测试中，均取得了开源模型中的顶尖成绩，充分展现了其在代码编写、Agent任务执行以及数学推理等方面的领先实力。

2025年7月12号 9:53

630

腾讯混元Hunyuan-A13B模型API上线

近日，腾讯云官网正式上线了腾讯混元A13B模型的API服务，输入价格定为每百万Tokens0.5元，输出价格则为每百万Tokens2元，这一举措迅速在开发者社区中引发了热烈反响。作为业界首个13B级别的MoE（混合专家）开源混合推理模型，Hunyuan-A13B以其总参数80B、激活参数仅13B的精简设计，实现了与同等架构领先开源模型相媲美的效果，同时在推理速度上更胜一筹，性价比显著提升。这一创新不仅降低了开发者获取先进模型能力的门槛，更为AI应用的广泛普及奠定了坚实基础。

2025年7月11号 16:12

1.1k

AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

【AI日报速览】1.智谱推出免费AI Slides，基于GLM模型快速生成专业PPT；2.可灵AI发布可图2.1，图像生成支持180种风格；3.NVIDIA推出DiffusionRenderer，实现视频转3D场景编辑；4.墨刀AI上线30秒生成可编辑原型功能；5.Higgsfield Soul ID用10张照片生成虚拟形象；6.谷歌开源GenAI Processors构建AI工作流；7.谷歌Veo3新增图转视频功能；8.Mistral AI发布专注代码生成的Devstral2507系列模型。

2025年7月11号 15:43

1.1k

墨刀AI重磅上线：输入想法30秒生成高保真、可编辑原型

墨刀AI推出30秒快速原型生成功能，支持多终端适配和对话优化。用户可通过文本、草图等多种输入方式生成高保真可编辑原型，并支持多轮对话调整。AI能智能解析上传的草图、线框图等，自动生成界面。提供双模式编辑、自动文档生成和代码联动功能，覆盖电商、社交等多场景需求，显著降低原型制作门槛，提升产品设计效率。

2025年7月11号 15:34

1.6k

5分钟生成专业PPT！智谱AI Slides火爆上线，GLM-Experimental带你体验未来办公

智谱AI推出革命性PPT生成工具AI Slides，基于最新GLM-Experimental模型开发。用户只需输入主题或上传文档，即可自动生成专业级PPT，包含智能排版、图表设计和视觉优化。该工具适用于商业报告、学术演示等场景，目前完全免费开放体验。社交媒体反馈显示其生成效果媲美专业设计，显著提升办公效率。用户可通过智谱清言官网抢先体验这一智能办公新功能。

2025年7月11号 15:05

1.6k

微软 BioEmu 模型实现蛋白质模拟时间大幅缩短

微软发布革命性BioEmu模型，将蛋白质动态模拟时间从数年缩短至数小时。该模型基于AlphaFold2改进，采用序列编码器和扩散生成技术，能生成多样化蛋白质构象。通过200毫秒分子动力学数据训练，显著提升模拟精度。这一突破将极大加速药物研发和生物医学研究，已在《自然》期刊发表。

2025年7月11号 10:50

1.1k

智谱上线了类似Manus的PPT生成功能AI Slides，免费使用无限制

智谱推出免费AI PPT生成工具"AI Slides"，基于GLM-Experimental模型，用户只需输入主题或文档即可自动生成结构清晰、排版专业的演示文稿。该功能支持数据可视化呈现，突出关键信息，大幅提升制作效率。目前可在chat.z.ai平台体验，适用于商务汇报和学术展示等多种场景。

2025年7月11号 9:42

2.9k

NVIDIA 推出 DiffusionRenderer：全新 AI 模型实现视频到可编辑的逼真 3D 场景

NVIDIA推出DiffusionRenderer技术突破视频生成瓶颈，实现3D场景的可控编辑。该技术采用双神经渲染器架构：逆渲染器提取场景几何材质数据，前向渲染器结合光照生成逼真视频。通过15万合成视频和1万真实视频数据集训练，模型在光影效果和材质还原上表现优异。支持动态光照调整、材质修改和对象插入等操作，大幅提升创作自由度。这项技术标志着AI视频生成从单纯创作迈向可编辑的新阶段。

2025年7月11号 9:28

1.4k

城商行掀起大模型招标潮，百万级投入成行业新风口！

中小银行加速布局大模型技术，超10家城商行近期启动相关项目招标，投资规模普遍在200-600万元之间。这些银行主要聚焦应用层开发，旨在优化服务流程、提升运营效率。典型案例显示，广西北部湾银行等项目报价达数百万元。相比国有大行动辄上亿的投入，城商行更注重性价比和实际应用效果。业内报告指出，银行业大模型应用正从试点走向多场景落地，推动行业智能化转型。

2025年7月11号 9:18

570

谷歌Veo3新增图像转视频功能，七周内用户创作超4000万个视频

谷歌为Veo3AI视频生成器新增图像转视频功能，该功能已整合进Gemini应用和Flow工具，覆盖150多国。目前仅限AI Ultra/Pro用户使用，每日限3次创作。用户可上传图片并添加音频描述生成视频，支持下载分享。数据显示7周内用户已创建超4000万视频。所有生成视频均带有可见"Veo"水印和不可见SynthID数字水印，谷歌还提供专用检测工具识别AI内容。

2025年7月11号 9:17

910

AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

全景图像生成新方法PanoFree：无需调优生成多视角图片

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

腾讯混元Hunyuan-A13B模型API上线

AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

墨刀AI重磅上线：输入想法30秒生成高保真、可编辑原型

5分钟生成专业PPT！智谱AI Slides火爆上线，GLM-Experimental带你体验未来办公

微软 BioEmu 模型实现蛋白质模拟时间大幅缩短

智谱上线了类似Manus的PPT生成功能AI Slides，免费使用无限制

NVIDIA 推出 DiffusionRenderer：全新 AI 模型实现视频到可编辑的逼真 3D 场景

城商行掀起大模型招标潮，百万级投入成行业新风口！

谷歌Veo3新增图像转视频功能，七周内用户创作超4000万个视频

AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

全景图像生成新方法PanoFree：无需调优生成多视角图片

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

月之暗面Kimi K2 模型发布并开源 擅长代码与 Agentic 任务

腾讯混元Hunyuan-A13B模型API上线

AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

墨刀AI重磅上线：输入想法30秒生成高保真、可编辑原型

5分钟生成专业PPT！智谱AI Slides火爆上线，GLM-Experimental带你体验未来办公

微软 BioEmu 模型实现蛋白质模拟时间大幅缩短

智谱上线了类似Manus的PPT生成功能AI Slides，免费使用无限制

​NVIDIA 推出 DiffusionRenderer：全新 AI 模型实现视频到可编辑的逼真 3D 场景

城商行掀起大模型招标潮，百万级投入成行业新风口！

谷歌Veo3新增图像转视频功能，七周内用户创作超4000万个视频

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

NVIDIA 推出 DiffusionRenderer：全新 AI 模型实现视频到可编辑的逼真 3D 场景