Gemini AI 实现视觉处理新突破：实时视频与静态图像同步分析

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2025年1月15号 11:32

245

谷歌的 Gemini AI 近期实现了一个令人瞩目的技术突破，它能够同时处理多个视觉流，这在人工智能领域是一项前所未有的成就。这一功能的亮相并不是通过谷歌的主流平台，而是通过一个名为 “AnyChat” 的实验性应用得以展示。

Gemini AI 的这一新能力使其不仅能够实时观看视频，还能同时分析静态图像，这打破了以往人工智能只能处理单一视觉输入的限制。Gradio 的机器学习负责人 Ahsen Khaliq 在接受采访时表示:“现在你可以在与 AI 进行对话的同时，让它处理你的实时视频和任何想分享的图像。”

AnyChat 的成功实现了这一多流处理能力，这得益于 Gemini AI 先进的神经网络架构。虽然这种能力在 Gemini 的 API 中已经存在，但尚未在谷歌的官方应用中向普通用户开放。许多 AI 平台，包括 ChatGPT，目前只能处理单一流的输入，当上传图像时会禁用实时视频流。

这项技术的潜在应用非常广泛。学生可以实时展示数学问题，并向 Gemini 展示教科书，获得逐步指导。艺术家可以分享正在创作的作品和参考图像，从而获得关于构图和技巧的实时反馈。

AnyChat 的技术突破并非偶然，开发团队与 Gemini 的技术架构紧密合作，成功地扩展了其能力。通过这些特别的权限，AnyChat 能够同时追踪和分析多种视觉输入，而不影响对话的连贯性。开发者只需简单的代码就可以复制这一能力，创建支持视频流和图像上传的自定义平台。

尽管 AnyChat 目前仍处于实验阶段，但其成功展示了多流 AI 视觉处理的现实潜力。无论是在医疗、工程还是教育等领域，Gemini 的这一新能力都将带来颠覆性的变化。

AnyChat项目:AnyChathttps://huggingface.co/spaces/akhaliq/anychat

划重点:
🌟 Gemini AI 实现实时视频与静态图像的同步处理，打破以往限制。
🎨 AnyChat 平台展示了 AI 在教育、艺术等领域的广泛应用潜力。
🚀 开发者可以轻松利用 Gemini 的技术构建自己的视觉 AI 应用。

谷歌Gemini推出 “全局记忆” 功能，让AI记住你的每一次对话

日前，谷歌宣布其旗下的 Gemini AI 正式推出 “全局记忆” 功能。这一新功能使得 AI 能够记住用户与其之间所有的对话，旨在为用户提供更加个性化和贴心的服务。根据官方介绍，用户在与 AI 交流时，将不再需要特意回顾过去的对话记录，AI 能够自然地承接上一次的讨论，提升交流的流畅性。要体验这一功能，用户需订阅 Gemini Advanced 服务，目前该功能仅在 Gemini App 和网页端提供，并暂时只支持英语，未来几周内还将扩展至其他语言。谷歌表示，通过这一功能，用户可以轻松要求 Gemini AI 总

Gemini AI 助手未来或加入原生广告，谷歌CEO透露盈利计划

谷歌的 Gemini AI 助手目前尚未引入广告，但这一情况可能在未来发生改变。在 Alphabet 的投资者电话会议上，首席执行官 Sundar Pichai 表示，公司对 Gemini 未来的广告展示方式有“非常好的想法”。尽管目前用户可以通过免费或付费订阅模式使用 Gemini，但广告可能会成为该产品的一部分。Pichai 在回应富国银行分析师关于 Gemini 盈利机会的提问时表示:“在盈利方面，我们目前专注于免费套餐和订阅模式。但正如你多年来在 Google 身上看到的那样，我们始终以用户体验为先导，对原生广告概念确实

谷歌CEO皮查伊认为Gemini已是市面最强，目标吸引五亿用户

在最新的报道中，谷歌 CEO 桑达尔・皮查伊对公司自家研发的 Gemini AI 技术表达了强烈的信心。他认为，Gemini 的能力已经超越了市场上的主要竞争对手，成为 “市面最强” 的 AI 技术。然而，他也指出，要让消费者真正关注这一技术，谷歌仍需付出更多努力。皮查伊最近向员工透露，他的目标是到2025年底前，Gemini 的聊天机器人能够吸引五亿用户。这一目标显得颇具挑战性，因为当前市场领军者 ChatGPT 的每周用户量已经达到了约三亿。尽管谷歌是 AI 领域的开创者之一，并且早在多年前就开

Gmail推出新 “插入” 按钮，使用Gemini回复邮件更轻松

近日，谷歌对 Gmail 进行了升级，为安卓用户引入了一个全新的 “插入” 按钮，旨在简化使用 Gemini AI 撰写邮件的流程。早在去年 8 月，谷歌便推出了 Gemini 功能，用户可以通过它来总结邮件、生成回复，或者对已撰写的草稿进行修改。这项功能的确很便捷，但在实际使用中存在一些不便之处，尤其是在手机上，用户需要手动复制粘贴 Gemini 生成的内容，这一过程并不顺畅。为了改善这一体验，谷歌在 Gmail 的安卓版本中增加了 “插入” 按钮。用户只需轻轻点击该按钮，Gemini 生成的回复内容