今天,腾讯宣布开源其混元3D 生成大模型2.0,并同步推出混元3D AI 创作引擎,标志着业界首个 “一站式3D 内容 AI 创作平台” 的正式上线。这一创新平台使得用户可以通过简单的文字或图片输入,快速生成高质量的3D 模型,极大地简化了3D 内容创作的过程。混元3D 生成大模型2.0在技术上进行了全面升级,特别是在几何和纹理两个关键方面。几何大模型主要负责捕捉3D 物体的形状与结构,腾讯采用了 Hunyuan3D-DiT 和 Hunyuan ShapeVAE 等先进技术,生成的 “白模” 效果与设计师手工建模相当。而纹
今日,腾讯宣布推出混元3D AI 创作引擎,旨在通过提示词或图片,快速生成高质量的3D 模型。该创作引擎集成了3D 功能矩阵、编辑工具、生成工作流及丰富的创作素材库,为设计师和创作者提供了极大的便利。用户只需输入简单的提示词,例如 “圆形棕色长形沙发” 或 “猫头鹰,大眼睛,深棕色”,便可轻松生成对应的3D 模型,并可选择不同的风格进行下载,支持主流3D 文件格式如 glb、fbx 和 obj。此外,该引擎还具备3D 动画、草图生成和3D 小游戏创作等多样化功能,大幅提升创作效率。
近日,浙江大学与阿里巴巴达摩院联合发布了一项引人瞩目的研究,旨在通过教学视频创建高质量的多模态教科书。这一创新的研究成果不仅为大规模语言模型(VLMs)的训练提供了新的思路,也可能改变教育资源的利用方式。随着人工智能技术的迅猛发展,VLMs 的预训练语料主要依赖图文对数据与图文交织语料。然而,当前的这些数据多来自网页,文本与图像的关联性较弱,知识密度也相对较低,无法有效支持复杂的视觉推理。为了应对这一挑战,研究团队决定从互联网上海量的教学视频
随着人工智能技术的迅猛发展,AI 生成的文本、图像和视频在各个领域的应用日益成熟。然而,这也伴随着信任危机的出现,虚假信息的传播对社会造成了潜在的威胁。为了应对这一挑战,腾讯于近日推出了一款全新的 AI 生成内容检测工具,旨在通过 AI 技术 “打假 AI”。这款工具由腾讯的朱雀实验室研发,分为 AI 生成文本检测和 AI 生成图像检测两个系统。腾讯官方指出,尽管 AI 生成的图像在外观上愈加真实,但仍然存在一定的可识别性。通过对上传图像进行几秒钟的快速验证,用户可