谷歌在最新的 Pixel9发布会上宣布推出了一项名为 Gemini Live 的语音聊天模式,这项功能将为 Gemini 的高级用户提供更为灵活的对话体验。Gemini Live 的工作原理与 ChatGPT 的语音聊天功能相似,用户可以在对话中选择多种声音进行交流,而且可以做到无缝的对话,甚至可以在对方讲话的同时进行打断,而无需轻触屏幕。

image.png

Gemini Live 的设计理念是让用户的对话变得 “自由流畅”,这意味着你可以在对方回答时随时插话,或者在需要的时候暂停对话,稍后再回来继续。这种新模式非常适合需要多任务处理的用户,因为即使在手机锁屏状态下,Gemini Live 也能在后台工作,确保用户随时都能获取信息。

image.png

早在今年的 I/O 开发者大会上,谷歌就首次透露 Gemini Live 即将到来,并表示该功能未来还将支持实时视频解析。现在,Gemini Live 已经在 Android 设备上推出,初期支持英语,并提供了10种新声音供用户选择,包括名字叫 Ursa 和 Dipper 的选项。谷歌也表示,未来会在几周内扩展到 iOS 设备和其他语言。

除了 Gemini Live,谷歌还推出了其他一些新功能,包括即将上线的应用扩展,涵盖 Keep、Tasks、Utilities 和 YouTube Music 等。此外,Gemini 还增强了对用户屏幕上下文的理解能力,类似于苹果在 WWDC 大会上发布的 AI 功能。用户可以通过点击 “询问这个屏幕” 或 “询问这个视频” 来获得信息,比如从旅行视频中提取目的地信息并直接添加到谷歌地图中。

划重点:

🌟 Gemini Live 推出了语音聊天功能,支持自由流畅的对话体验。

🎤 新增10种声音选项,用户可以在对话中选择不同的声音。

📱 该功能目前在 Android 设备上推出,未来将扩展至 iOS 和更多语言。