DiffSensei：自动将书面故事转换为漫画风格的人工智能系统

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jan 3, 2025

560

近日，研究人员开发了一种创新的人工智能系统——DiffSensei，能够自动将书面故事转换成漫画风格。这一系统不仅可以保持角色外观的一致性，还能控制漫画页面的布局，展现了AI在漫画创作领域的巨大潜力。

该项目是由北京大学、上海人工智能实验室和南洋理工大学联合研发的，结合了扩散模型与大型语言模型，旨在处理漫画创作中的视觉和叙事元素。为了展示DiffSensei的功能，研究团队创作了一部虚构漫画，讲述了人工智能领域先驱杰弗里·辛顿、扬·勒昆和约书亚·本吉奥的故事。漫画讲述了三位科学家如何开发能够超越Transformer架构的人工智能模型，并最终获得诺贝尔奖。

Image: Wu et al.

DiffSensei的工作原理

DiffSensei使用多模态模型和LoRA技术，确保漫画中的角色在每个面板上保持一致的外观。该系统通过三步实现漫画创作:首先是生成页面布局，接着绘制角色，最后添加对话文本。

为了训练DiffSensei，研究人员构建了一个名为MangaZero的数据集。该数据集包含了来自48个不同漫画系列的43，000多页漫画和427，000个单独面板，每个面板都进行了详细标注，记录了角色位置和对话位置，这对于系统的顺利运行至关重要。

Image: Wu et al.

未来的潜力与挑战

尽管DiffSensei展示了巨大的潜力，但该系统仍然面临一些挑战。当前，当角色的参考图像不够清晰时，系统可能会出现错误，有时相似人物会被误融合。而且，若没有明确的角色参考，生成的艺术作品可能显得平淡，无法完美呈现特定漫画风格。

研究人员相信，DiffSensei能够在未来极大地简化漫画制作过程。该技术为艺术家、出版商和创作者提供了一个新的工具，使他们能够轻松制作个性化的漫画，同时保持对角色和页面布局的精确控制。

DiffSensei 人工智能漫画创作扩散模型

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

顶级生成式AI用例揭晓：营销任务排名较低

根据最新的研究，生成性人工智能（Gen AI）在市场营销领域的应用远不如个人使用那么普遍。一份由 Marc Zao-Sanders 发布的《Top-100Gen AI Use Case》报告显示，尽管人们在日常生活中越来越多地利用 AI 来获得情感支持，市场营销的相关任务，如广告创作和社交媒体内容生成，却位居使用排名的后列。报告分析了人们对生成性 AI 的使用情况，并指出，过去一年中，使用重点从技术驱动转向了以情感和个人福祉为中心的应用。根据研究，前三名的应用包括: 1. 心理治疗和陪伴 2. 生活组织 3. 寻找生

2025年4月14号 14:11

470

伦敦AI创意工作室 Wonder 获 300 万美元融资 ElevenLabs、OpenAI负责人参与投资

近日，位于伦敦的创意工作室 Wonder 宣布成功获得300万美元的种子轮融资，融资由 LocalGlobe 领投，其他投资者包括澳大利亚风险投资公司 Blackbird、AI 语音初创公司 ElevenLabs 的联合创始人 Mati Staniszewski、OpenAI 初创团队负责人 Laura Modiano、以及谷歌 DeepMind 的设计负责人 Ammaar Reshi 等。这家工作室致力于利用人工智能技术制作娱乐和广告领域的电影。图源备注:图片由AI生成，图片授权服务商MidjourneyWonder 的创始人 Justin Hackney 是一位获得 BAFTA 奖的电影制片人，曾担任 ElevenLabs 的创意总监，而 CEO Xa

2025年4月14号 14:03

330

Google AI Studio开放Veo 2视频模型有限免费试用

人工智能视频生成技术持续掀起热潮。近日，AIbase从社交媒体获悉，Google AI Studio已开始向部分用户开放其先进的Veo2视频模型有限免费试用。这一消息引发了广泛关注，尽管试用次数受限且冷却时间尚未明确，Veo2的强大性能仍令人期待。以下是AIbase基于最新信息的深度报道，带您了解这一动态的背后细节与意义。Veo2免费试用:有限机会引发热议据社交媒体反馈，Google AI Studio近期对部分用户解锁了Veo2视频模型的免费试用权限。Veo2作为Google DeepMind开发的最新一代AI视频生成工具，以其支持高达

2025年4月14号 13:49

130

阿里巴巴旗下Lazada推出AI助理Lazzie Seller助力商家运营

阿里巴巴集团旗下东南亚电商平台Lazada于4月14日宣布推出人工智能助理Lazzie Seller，旨在提升商家的运营效率和市场竞争力。这款AI助理基于Lazada在电商运营领域的深厚积累，利用自然语言处理技术，能够快速回应商家在日常运营中遇到的各种问题。其核心功能包括功能导航、店铺风险评估以及提供专业建议等，有效帮助商家降低运营成本。Lazzie Seller的推出标志着Lazada在电商领域技术创新的又一重要举措。目前已有多家商家对这一AI助理表示出浓厚兴趣，他们乐于接受新技术，并愿意尝试La

2025年4月14号 13:48

710

AI 天气模型助力社区级精准预测，保险行业积极参与

近年来，天气预报行业在准确性方面取得了显著进展，但在局部天气预测方面依然面临挑战。随着人工智能天气模型的迅速发展，许多小型商业公司开始具备快速进行专业化天气预测的能力。这些预测不仅可以告诉你某个邻里何时会下雨，还能准确预报风速，以便更好地调整风力发电机的运行。传统上，公共气象机构依赖大型超级计算机来处理复杂的物理方程，从而提供全球天气预报。然而，随着气候变化使得极端天气事件的发生频率增加，对更加细致入微的天气预报的需求变得愈发迫切

2025年4月14号 10:51

410

全球数据中心电力需求将在2030年翻倍，AI 成主要推动力

根据国际能源署（IEA）的最新研究，全球数据中心的电力需求预计将在2030年前翻倍，超越日本的总电力消费，其中人工智能(AI)是主要推动因素。IEA 的报告显示，预计在未来五年内，数据中心将推动发达经济体超过20% 的电力需求增长，而大部分增长将归因于 AI 的广泛应用。根据 IEA 的统计，2024年，美国占全球数据中心电力消费的45%。到2030年，这一比例将显著上升，预计美国数据中心的电力消费将超过整个国家的能源密集型制造业，包括铝、钢铁、水泥和化学品等行业。在美国，数据中心

2025年4月14号 10:06

620

斯坦福权威报告盖章！阿里通义千问贡献排名全球第三！用算力优势重塑全球竞争格局！

近日，斯坦福大学人工智能研究所发布了《2025年人工智能指数报告》，为全球人工智能领域的发展提供了新的视角。报告指出，阿里巴巴在全球重要大模型贡献中位居第三，成为中国科技公司的领军代表。报告显示，2024年，中国在全球 AI 大模型中贡献了15项，而阿里巴巴的6个模型入选，紧随谷歌与 OpenAI 的7个模型之后。这一成就不仅反映了阿里在技术研发上的持续努力，也展示了中美在 AI 领域的竞争差距正逐步缩小。阿里巴巴的 “通义千问” 系列模型无疑是其成功的关键。根据报告，

2025年4月12号 9:41

10.7k

Digital Promise推出AI产品认证计划保障教育技术工具的安全与公正

近日，非营利组织数字承诺（Digital Promise）宣布推出 “负责任设计的 AI 产品认证” 计划，旨在帮助学校领导选择符合学生学习与安全要求的人工智能驱动教育技术工具。随着 AI 在教育领域的迅速发展，学校面临着越来越多的选择，如何挑选出安全且有效的工具成为了一个重要课题。该认证项目特别针对人工智能教育工具的多个关键方面进行评估，包括数据安全性、公平性以及透明度。为了获得认证，教育技术供应商必须证明其产品符合一系列要求，例如:清晰说明数据收集和使用的方式

2025年4月11号 16:42

15.4k

英格兰银行警告:生成式AI可能加剧股市波动与操控风险

股市本就充满不确定性，如今英格兰银行发出了警告:生成式人工智能的应用可能会进一步放大市场波动，甚至带来股市操控的风险。根据该银行金融政策委员会发布的一份报告，随着AI技术在金融市场的广泛采用，市场可能会趋向单一化，并由此带来“羊群效应”，使得股市波动更加难以预测。英格兰银行担忧，随着自主机器人不断学习市场波动的规律，它们可能意识到，通过在波动中进行交易可以带来利润。这一现象，可能导致类似2010年“闪电崩盘”的事件变得更加频繁和难以避免。当

2025年4月11号 14:45

7.5k

国家重磅投资：新设AI基金将注入82亿美元助力早期项目

中国近期宣布成立一项600亿元人民币的国家基金，专注于早期人工智能(AI)项目的投资。这一举措显示了北京在推动 AI 行业发展方面的决心，并旨在通过国家主导的投资进一步提升中国在全球科技竞争中的地位。根据中国工业和信息化部的官员张建华在深圳举行的会议上透露，这一 “人工智能产业投资基金” 于今年1月成立，得到了工业和财政部门的共同指导。基金的设立不仅是对 AI 领域的关注，还反映了国家对技术创新的重视，特别是在全球技术竞争加剧和美国对中国高

2025年4月11号 14:01

6.1k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图