在刚刚结束的 MWC 展会上,谷歌正式推出了其 Gemini Live 的新功能,标志着 Project Astra 与 Gemini Live 的整合得以兑现。这些新功能不仅能让用户共享手机屏幕,还能通过智能手机的摄像头进行实时视频互动,这对于提升人工智能助手的使用体验无疑是一次重大飞跃。

谷歌的发言人 Alex Joseph 在邮件中确认了这一消息,并表示新功能已经开始向用户推广。通过一个名为 “Share screen with Live” 的新按钮,用户可以轻松共享他们的手机屏幕。一位 Reddit 用户甚至已经率先体验了这一功能,并发布了视频证明。视频中,Gemini 实时根据用户共享的屏幕信息,准确回答了今天的日期和当前气温等问题。

image.png

除了屏幕共享功能,Gemini Live 还推出了实时视频解读功能。用户只需打开手机摄像头,Gemini 就能对所拍摄的画面进行解析并回答相关问题。在谷歌发布的一段示范视频中,用户向 Gemini 求助,询问哪种颜料最适合上釉陶器。几乎没有延迟,Gemini 便给出了详细的建议,展示了其强大的实时处理能力。

image.png

Project Astra 是谷歌去年推出的 AI 智能体项目,旨在实现与大型模型的实时视觉和语音交互。其核心特点包括:低延迟的音频和视频对话、多语言支持、能够记住过去对话的关键细节,甚至在对话中使用谷歌搜索和地图等工具。更值得一提的是,Project Astra 可以跨设备使用,用户可以在安卓手机或特制眼镜上享受这一功能。

与谷歌的快速推进形成鲜明对比的是,苹果在 Siri 的升级上却陷入了停滞。根据彭博社的报道,苹果高管在内部会议中承认 Siri 的 AI 功能升级远未达标,许诺的 Apple Intelligence 也遥遥无期。这样的进展速度让苹果在人工智能竞赛中显得有些滞后。

谷歌的这一新功能上线,不仅展示了其在人工智能助手领域的强大实力,也让人对未来的 AI 交互充满期待。尽管苹果在此方面面临挑战,但行业内竞争的加剧将推动更多创新和改进,最终受益的将是广大用户。