相关AI新闻推荐

Reply扩大创意实验,推出AI音乐大赛与重返AI电影节
意大利都灵消息 ——Reply 公司近日宣布,出于对创新文化的追求以及对年轻一代使用新技术的热情,他们将启动一项全新的 AI 音乐大赛,并且迎回第二届 AI 电影节。这两个国际赛事旨在为创意人才提供展示自己才能的舞台,并通过人工智能来推动艺术创作的新边界。首先,Reply 与欧洲著名电子音乐节 Kappa FuturFestival 联手推出的 AI 音乐大赛,邀请年轻艺术家们在音乐中融入 AI 技术。比赛的主题为 “体验节拍”,鼓励参赛者创造五分钟的沉浸式音乐表演,结合音乐、视觉艺术和观众互动。

推理版局部重绘方法LanPaint,零训练修复图片
近日,开发者 scraed 在 GitHub 上发布了 LanPaint,一个无需额外训练的图像修复工具。该工具旨在帮助用户在任何稳定扩散模型(SD)上实现高质量的图像修复效果,甚至包括用户自己训练的自定义模型。LanPaint 通过多次迭代让模型在去噪之前 “思考”,从而获得更为无缝和准确的修复结果。LanPaint 的主要特点之一是零训练修复。用户可以立即在任何 SD 模型上使用该工具,无需进行繁琐的训练过程。此外,LanPaint 的集成十分简单,用户可以像使用标准的 ComfyUI KSampler 一样进行操作,流畅的工

佳士得首场 AI 艺术拍卖引发争议,成交额达 72.8 万美元
近日,著名拍卖行佳士得(Christies)举行了首次以人工智能(AI)为主题的艺术拍卖会,此次拍卖会名为 “增强智能”(Augmented Intelligence),在全球范围内引发了广泛的关注与争议。根据佳士得的数据显示,拍卖会共吸引了超过30件作品,最终成交额达728,784美元。图源备注:图片由AI生成,图片授权服务商Midjourney然而,这场拍卖会并非一帆风顺。在拍卖前,超过5,600名艺术家联合签署了一封公开信,要求佳士得取消此次拍卖。公开信中指出,许多参拍作品是通过未经授权的 AI 模型训练而成,

谷歌推出Imagen 3图像生成 API,每张仅需0.03美元
谷歌近日宣布,旗下最新的图像生成模型 ——Imagen3,现已通过 Gemini API 向开发者开放。这个模型不仅具备强大的图像生成能力,还能根据输入的文本提示创造出多种艺术风格的图像,涵盖从超现实主义到动漫角色的广泛范畴。Imagen3的使用非常简单,开发者只需通过 API 提交文本描述,模型便会迅速生成高质量图像。每张图像的生成成本仅为0.03美元,适合需要批量图像生成的开发者和企业。通过这一合理的定价策略,谷歌旨在降低创意工作的门槛,让更多人能够享受 AI 带来的艺术创作乐趣

字节开源嘴型同步模型LatentSync,实现超真实口型同步
近日,字节跳动发布了名为 LatentSync 的新型口型同步框架,旨在利用音频条件潜在扩散模型实现更精确的口型同步。该框架基于Stable Diffusion,针对时间一致性做了优化。与以往的基于像素空间扩散或两阶段生成的方法不同,LatentSync 采用端到端的方式,无需中间运动表示,能够直接建模复杂的音频与视觉之间的关系。在 LatentSync 的框架中,首先使用 Whisper 将音频频谱图转换为音频嵌入,并通过交叉注意力层将其集成到 U-Net 模型中。框架通过将参考帧和掩码帧与噪声潜在变量进行通道级拼接

字节跳动开源全新AI模型LatentSync 精准控制唇形同步
字节跳动近日开源了一项名为 LatentSync 的创新技术,该技术是一种基于音频条件的潜在扩散模型的端到端唇同步框架。这项技术无需任何中间运动表示,即可实现视频中人物唇部动作与音频的精准同步。与以往基于像素空间扩散或两阶段生成的唇同步方法不同,LatentSync 直接利用了 Stable Diffusion 的强大功能,能更有效地建模复杂的视听关联。研究发现,基于扩散的唇同步方法在时间一致性方面表现不佳,因为不同帧之间的扩散过程存在不一致性。为了解决这个问题,LatentSync 引入了时间表示

Stable Diffusion 3.5 Large正式上线亚马逊 Bedrock平台
在近日的 AWS re:Invent 大会上,Stable Diffusion3.5 Large(SD3.5Large)宣布正式在亚马逊 Bedrock 平台上可用。作为 AWS 的完全托管平台,Bedrock 旨在为开发者提供构建和扩展生成式人工智能应用的基础模型。通过将 SD3.5Large 引入亚马逊 Bedrock,Stability AI 希望满足开发者在可信的 AWS 环境中进行工作和部署的需求,从而使初创企业和大型企业能够安全、便捷地使用这一先进模型,而无需担心额外的基础设施问题。Stable Diffusion3.5 Large在文本到图像生成方面表现卓越,具有多种关键能力。首先,它支持多样

AI日报:智谱AI发布AutoGLM升级版;Kimi灰测AI视频生成功能;SD3.5L新增三大ControlNet功能;ChatGPT诞生两周年
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、震撼来袭!公司通过融资和技术创新,尤其是超级计算机的建设,进一步巩固了其在行业中的地位。

AI日报:SD 3.5 Medium模型免费开放商用;Hedra 推出全新语音克隆功能;微信灰度测试AI问答功能;ComfyUI新神器ComfyUI-Detail-Daemon
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、免费开放商用!这款助手基于Anthropic的Claude3.5Sonnet模型,能够自动处理代码重构和文档生成,提升开发者工作效率。

利用人类注意力可以改善人工智能生成的图像
最近的一项研究提出了一种新方法,利用人类注意力来改善人工智能生成的图像质量。该方法使用显著性检测器来识别图像中最重要的区域,并优先考虑这些区域的生成。传统的图像生成方法会统一优化整个图像,而新方法则利用显著性检测器来识别和优先考虑更“重要”的区域,就像人类一样。这种方法可以提高图像质量和文本提示的保真度。研究人员使用了稳定扩散模型和显著性检测器来生成图像,并将其与传统方法进行了比较。结果表明,新方法在图像质量和文本提示的保真度方面