AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

RPG-DiffusionMaster：LLM优化SD文本到图像的框架

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Jan 23, 2024

站长之家报道，RPG-DiffusionMaster是一个利用LLM优化SD文本到图像的框架，支持多种大语言模型，提供多功能特性，实验结果显示其在图像生成领域具有高准确度和广泛适用性。

大语言模型文本到图像 RPG-DiffusionMaster

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

Anthropic 发布 Claude Code 最佳实践指南，助力开发者无缝集成 AI 编程工作流

Anthropic 近日发布了一份详尽的 Claude Code 最佳实践指南，为开发者提供了一个以命令行界面（CLI）为核心的低层次工具，旨在将 Claude 大语言模型无缝融入日常编程任务中。这一指南基于 Anthropic 内部的实践经验，强调灵活、安全且高效的编码模式，为希望将 AI 融入现有开发环境的工程师提供了重要参考。Claude Code:极简主义与代理开发的融合Claude Code 是一个原生集成于命令行环境的开发助手，设计上避免了强制性的工作流框架，而是通过提供上下文丰富的交互工具，让开发者能够根据需求自

2025年4月22号 9:34

970

GLM-4-32B 与 GLM-Z1-32B 在 OpenRouter 上线，免费开放

清华大学 KEG 实验室（THUDM）研发的 GLM-4-32B 及 GLM-Z1-32B 两款前沿大语言模型(LLM)正式在 OpenRouter 平台上线，且完全免费向全球用户开放。这一里程碑式的事件标志着高性能 AI 模型的普及迈出了重要一步，为开发者、研究人员及 AI 爱好者提供了强大的工具，以推动人工智能应用的进一步创新。模型上线:性能强劲，免费开放GLM-4-32B 作为一款拥有320亿参数的通用大语言模型，以其在复杂推理、数学能力及多语言处理方面的卓越表现，成为当前开源 LLM 领域的佼佼者。与此同时，GLM-Z1-32B 是基于

2025年4月22号 8:56

1.6k

AI日报：昆仑万维开源SkyReels-V2；讯飞星火X1全新升级；扣子空间Coze Space内测

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、昆仑万维开源SkyReels-V2：无限时长电影生成模型昆仑万维的SkyReels团队推出了SkyReels-V2，这是全球首个基于扩散强迫框架的无限时长电影生成模型。该模型通过结合多模态大语言模型、强化学习等技术，显著提升了视频生成的质量和效率。SkyReels-V2不仅在技术上取得突破，还拓展了应用场景，

2025年4月21号 15:45

3.2k

新框架d1引领扩散模型推理进步，掀起强化学习应用新风潮

在人工智能的不断发展中，扩散模型在推理能力上逐渐崭露头角，现如今，它们不再是自回归模型的 “跟随者”。近日，来自加州大学洛杉矶分校（UCLA）和 Meta 的研究者们联合推出了一种名为 d1的新框架，该框架结合了监督微调(SFT)和强化学习(RL)，使扩散模型具备更强的推理能力，包括数学理解、逻辑推理等。这一创新的 d1框架通过两阶段的后训练策略来提升掩码大语言模型（dLLM）的性能。在第一阶段，模型通过高质量的推理轨迹进行监督微调，从而掌握基础知识和逻辑推理能力。接着

2025年4月21号 11:52

5.7k

昆仑万维开源SkyReels-V2：无限时长电影生成模型

昆仑万维 SkyReels 团队正式发布并开源了 SkyReels-V2，这是全球首个使用扩散强迫（Diffusion-forcing）框架的无限时长电影生成模型。该模型通过结合多模态大语言模型(MLLM)、多阶段预训练、强化学习和扩散强迫框架来实现协同优化，标志着视频生成技术迈入了一个新的阶段。

2025年4月21号 11:01

4.1k

Persona Engine开源发布，AI虚拟助手与Live2D融合打造交互新体验

近日，Persona Engine（人格引擎）项目正式开源，凭借其融合大语言模型(LLM)、Live2D、自动语音识别(ASR)、文本转语音(TTS)以及实时语音克隆(RVC)等前沿技术的强大功能，引发了AI与虚拟内容创作领域的广泛关注。据AIbase了解，该项目通过赋予虚拟角色自然对话与动态表情能力，实现了与虚拟人物的实时交互，特别适用于VTubing、直播和虚拟助手场景。项目已在GitHub上线，标志着AI驱动虚拟交互技术的又一里程碑。图源备注：图片由AI生成，图片授权服务商Midjourney核心功能:多技术融合实现沉浸式交

2025年4月21号 10:29

2.0k

Intel 开源 AI Playground，可用intel Arc 显卡使用各种AI模型

Intel 宣布将其生成式 AI 软件 AI Playground 正式开源，这一举措引发了 AI 社区的广泛关注。作为一款专为 Intel Arc GPU 和集成显卡优化的 AI 工具，AI Playground 被描述为一个“AI 中心”，支持本地运行聊天式大语言模型（LLM）以及图像和视频生成功能。此次开源标志着 Intel 在推动生成式 AI 技术普及和社区协作方面迈出了重要一步。开源 AI Playground：功能与潜力AI Playground 是一款功能强大的 AI PC Hannah’s Way 软件，支持多种生成式 AI 模型，包括图像扩散模型（如 Stable Diffusion 1.5、SDXL、Flux.1-Schnell 和

2025年4月21号 8:52

2.1k

谷歌利用 AI 技术去年封停 3920 万广告账号，效果显著

谷歌近期宣布，2022年该公司成功封停了3920万个广告主账号，数量是2023年的三倍。这一成绩主要归功于谷歌在广告审核中应用的先进人工智能技术。通过大语言模型的辅助，谷歌能够在广告投放前识别出商业冒充、非法支付信息等违规行为，从而快速暂停大部分广告账户。谷歌广告安全总经理亚历克斯・罗德里格兹在一次虚拟媒体会议上指出，这些 AI 模型在改进广告安全方面发挥了重要作用，尽管如此，整个过程仍有人工审核的参与。他透露，谷歌成立了一个由100多名专家组成的团队，成

2025年4月17号 10:13

2.4k

微信上线元宝AI好友功能，强化超级应用生态对竞争对手形成新挑战

微信于2025年4月16日正式推出元宝AI好友功能，允许用户将腾讯自研的AI助手元宝添加为微信联系人，直接在聊天窗口进行交互。这一功能的发布不仅增强了微信作为超级应用的粘性，也对其他AI聊天服务和小程序构成显著竞争压力。以下是AIbase对元宝AI好友功能的深度解析，探讨其技术亮点、用户体验及对行业的潜在影响。元宝AI好友上线:无缝融入微信生态元宝是腾讯基于其混元（Hunyuan）大语言模型开发的AI助手，此前通过微信小程序或独立应用提供服务。AIbase了解到，新推出的元宝AI好友

2025年4月17号 9:02

1.6k

智谱开源32B/9B 系列 GLM 模型，32B参数媲美DeepSeek R1，速度快8倍

备受瞩目的国内人工智能企业智谱华章（以下简称“智谱”）近日正式宣布，开源其新一代 GLM 系列大语言模型。此次开源力度空前，不仅包含 32B 和9B 两种参数规模的模型，更涵盖了基座模型、推理模型以及代表未来探索方向的沉思模型。所有开源模型均遵循宽松的 MIT 许可协议，为开发者提供了极大的自由度和商业应用的可能性。与此同时，该系列模型已通过智谱全新平台 Z.ai 免费开放体验，并同步上线智谱 MaaS 平台（bigmodel.cn）。开源赋能:技术普惠与创新加速本次智谱开源的 GLM 模

2025年4月15号 10:52

5.0k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图