阿里推出DreaMoving可控视频生成框架,实现高度定制化人类视频

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
微信平台推出了首个 AI 助手 ——“元宝”。用户只需在微信中搜索 “元宝”,添加为好友后,即可轻松与其进行对话。与传统的聊天机器人不同,元宝以好友的身份出现,无需下载其他应用或小程序,聊天时甚至会显示 “对方正在输入...” 的信息,带来更加真实的互动体验。元宝 AI 是腾讯最新开发的 AI 助手,搭载了混元和 DeepSeek 双模引擎,能够无缝接入微信生态。其强大的功能包括快速解析微信公众号文章、图片和文档,并在此基础上提供简短的评论和详尽的解读。用户还可以通过
日前,JetBrains 公司正式宣布其全新的编码智能体 ——Junie AI,已达到 “生产就绪”(production-ready)的状态。这意味着,开发者们可以利用 Junie AI 更高效地处理编写代码和调试运行等复杂任务。Junie AI 的推出,标志着 JetBrains 在 AI 工具领域的又一重大进展。除了 Junie AI,JetBrains 还对其旧版 AI 助手进行了更新,支持接入最新的 AI 模型,包括 Anthropic Claude3.7Sonnet 和 Google Gemini2.5Pro。这些更新使得 AI 助手能够提供更加精准的代码建议和辅助功能,同时新增了聊天界面的多文件编辑功能,进一步
据彭博社报道,人工智能公司 Anthropic 正在积极开发其聊天机器人 Claude 的新功能 —— 语音助手,预计本月内将正式发布。这一新功能将使 Claude AI 与 OpenAI 的 ChatGPT 在交互体验上展开竞争,丰富用户与 AI 的交流方式。距离 OpenAI 推出类似功能已近一年,Claude 的语音模式显然是对这一市场需求的及时回应。新语音助手将首先在 Claude 的 iOS 应用上推出,并可能在其他平台上也随之上线。根据目前掌握的信息,用户将能够选择三种不同的语音风格:轻快(Airy)、温和(Mellow)以及具有英国口音的顺
OpenAI 最近推出了其最新的人工智能模型,名为 o3。这款模型标志着 AI 在理解和分析图像方面的一次重大进步,尤其是在处理低质量草图和图表方面。与此同时,OpenAI 还发布了一个较小的版本 o4-mini,进一步丰富了其产品线。o3模型的核心功能在于能够 “用图像思考”,这意味着用户可以上传各种图像,如白板草图和复杂的图表,让 AI 进行深入分析和讨论。这一进展使得 AI 不仅仅停留在文本分析的层面,而是能够将视觉信息整合进推理过程中,从而更高效地解决复杂问题。用户能够通过图
彭博社率先报道,OpenAI 正与人工智能辅助编程工具 Windsurf(前身为 Codeium)展开收购谈判,交易金额约为30亿美元。这一潜在收购将成为 OpenAI 迄今为止最大规模的并购交易,标志着其在 AI 驱动的开发者工具市场迈出重要一步。Windsurf:AI 编程领域的明星工具Windsurf 是一款广受开发者欢迎的 AI 编程助手,能够基于自然语言提示生成代码、解释现有代码并执行相关任务。它不仅支持通过插件嵌入主流代码编辑器(如 Visual Studio Code),还提供专为 AI 辅助开发设计的自定义编辑器。Windsurf 自称是
微信于2025年4月16日正式推出元宝AI好友功能,允许用户将腾讯自研的AI助手元宝添加为微信联系人,直接在聊天窗口进行交互。这一功能的发布不仅增强了微信作为超级应用的粘性,也对其他AI聊天服务和小程序构成显著竞争压力。以下是AIbase对元宝AI好友功能的深度解析,探讨其技术亮点、用户体验及对行业的潜在影响。元宝AI好友上线:无缝融入微信生态元宝是腾讯基于其混元(Hunyuan)大语言模型开发的AI助手,此前通过微信小程序或独立应用提供服务。AIbase了解到,新推出的元宝AI好友
近日,谷歌宣布其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。这一功能最早于本月早些时候仅限于 Pixel9和三星 Galaxy S25用户,通过 Gemini Advanced 订阅才能使用。然而,随着用户对 Gemini Live 功能的积极反馈,谷歌决定改变策略,推动这一功能的普及。Gemini Live 功能的强大之处在于它能够实时识别用户手机摄像头和屏幕上的内容,并提供相应的信息和反馈。想象一下,当你在水族馆中,使用手机摄像头对着某只动物时,Gemini 可以即时识别出这是什么生物,并分享它的相关信息,
OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。这次发布的 o3和 o4-mini 模型在多模态处理上表现出色,具备了图像处理、网页搜索和代码执行等功能。开发者可以通过 API 方便地接入这些模型,使用更强大的工具和功能。例如,o3不仅能够进行复杂问
近日,英国初创公司 Synthesia 凭借在企业 AI 生成视频领域的杰出表现,成功获得了 Adobe 的战略投资。自成立以来,Synthesia 在 AI 视频化身技术上不断创新,目前已成为行业的领军者。据悉,Synthesia 的年度经常性收入已突破1亿美元,成为众多企业视频解决方案的首选。目前,全球已有超过6万家公司使用 Synthesia 的服务,其中70% 以上是财富100强企业。每天,这个平台生成的 AI 视频数量以千计,充分展现了其在市场上的影响力。Synthesia 的独特之处在于其平台允许企业利用 AI 化身来创建生动的
OpenAI 正式发布了其最新开源项目 Codex CLI,这是一款轻量级的代码智能体工具。该工具的发布迅速引起了极大的关注,仅在短短5小时内,Codex CLI 便突破了5000颗星的评价,预计今天有望突破1万颗星,迅速成为 Github 上的一颗新星。OpenAI 的联合创始人兼总裁 Greg Brockman 表示,Codex CLI 只是他们代码工具系列的第一款,未来将继续推出更多的智能体产品。Codex CLI 的开源地址已经公布。Codex CLI 具备多种强大的功能,能够根据用户输入的提示自动生成代码文件、运行代码、安装缺失的依赖并实时展