斯坦福大学的研究人员提出了𝘚𝘬𝘦𝘵𝘤𝘩-𝘢-𝘚𝘬𝘦𝘵𝘤𝘩,一个能够将草图变成画作的模型。通过该模型,用户只需随笔一画,即可生成高清画作。该模型还可以为下一步的绘画提供建议。研究人员通过训练模型使用随机部分草图,使其能够处理任意完整程度的草图,并生成对应的图像。这项技术将对艺术创作产生重大影响。
相关AI新闻推荐
国产大模型“抢滩”港股:MiniMax、智谱、月之暗面竞逐“AI第一股”
国内大模型赛道正从技术竞争转向资本竞速。MiniMax、智谱AI与月之暗面三家头部AI独角兽正密集推进港股上市计划,争夺“中国大模型第一股”头衔。目前三家公司均未公开置评,但多方信源显示上市暗战已打响,其中MiniMax或最早敲钟。

Mistral重磅开源Devstral 2:123B编码神器+SWE-bench 72.2分,免费API+本地CLI炸裂来袭!
欧洲AI公司Mistral AI发布新一代开源编码模型家族Devstral2,包括123B参数旗舰版和24B轻量版,并推出配套命令行工具Mistral Vibe CLI,支持自动化编程。该模型在SWE-bench基准测试中获72.2分,接近顶级闭源模型性能,且API目前免费开放,为开发者提供强大助力。
蚂蚁开源 LLaDA2.0,业内首个100B 参数规模的扩散语言模型
蚂蚁技术研究院发布LLaDA2.0系列,包含16B和100B版本,其中100B版为业内首个百亿参数离散扩散大语言模型。该模型突破扩散模型规模化瓶颈,显著提升生成质量与推理速度,为领域发展提供新方向。

AI日报:Medeo AI新版视频Agent上线:OpenAI正式发布GPT-5.2;钉钉AI功能大升级
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、MedeoAI新版视频Agent震撼登场:自然语言一键改剧本,内容创作从此零门槛!NotebookLM作为一款智能笔记生成平台,此次升级不仅提升了生成能力优化了用户体验,助力专业人士和创作者高效处理复杂信息。
Medeo AI新版视频Agent震撼登场:自然语言一键改剧本,内容创作从此零门槛!
Medeo AI新版视频生成工具实现重大突破,支持复杂提示词和自然语言实时修改,告别传统一次性生成模式,允许用户无限迭代编辑内容,极大提升创作自由度。

轻松打造 3D 手办!拓竹旗下3D模型平台 MakerWorld接入腾讯混元3D 3. 0 大模型
拓竹科技推出“印你”3D手办生成器,基于腾讯混元3D3.0大模型,用户上传图片即可生成高质量可打印3D模型,降低定制门槛,为爱好者和新手提供便捷创作工具。
Meta开源神话崩塌:闭源新模型竟靠阿里Qwen训练,小扎“煲汤求才”换来战略大转向
Meta计划于2026年春季发布代号“Avocado”的AI模型,可能转向闭源,并使用了阿里巴巴开源模型Qwen进行训练。消息引发市场关注,阿里巴巴股价上涨。
迪士尼与 OpenAI 达成协议,授权使用热门角色创作视频与图像
迪士尼与OpenAI达成三年合作,允许后者使用旗下200多个角色进行AI创作,主要用于Sora视频和ChatGPT图像生成。合作成果将在Disney+平台展示,但具体视频选择标准尚未公布。

智谱多模态开源周圆满落幕:四项视频生成核心技术全面开放
智谱团队开源四项视频生成核心技术,包括GLM-4.6V视觉理解、AutoGLM设备控制、GLM-ASR语音识别和GLM-TTS语音合成模型,展示其在多模态领域的最新进展,为视频生成技术发展奠定基础。

Runway发布通用世界模型GWM-1,用像素预测构建可推理的虚拟世界
Runway推出通用世界模型GWM-1,通过逐帧像素预测模拟物理规律与时间演化,正式加入谷歌、OpenAI等巨头的“世界模型”竞赛,旨在为具身智能和通用人工智能构建核心基础设施。