谷歌近日为其Gemini人工智能助手推出了两项重要新功能:Canvas协作工作空间和Audio Overviews音频概览,进一步增强了其AI助手的实用性和用户体验。

Canvas:实时协作文档创建

Canvas功能为用户提供了一个交互式工作区,使用户能够与AI协作创建文档和代码。该功能支持实时显示更改,并通过集成的聊天界面让用户讨论修改内容。

特别值得注意的是,Canvas能够生成HTML和React代码的即时预览,完成的文档可以直接导出到Google Docs。业内分析指出,这一功能与去年秋季ChatGPT推出的同名功能颇为相似。

Audio Overviews:将文字转化为对话式音频

Audio Overviews功能允许用户将文档、演示文稿和研究报告等书面内容转换为播客式对话,由两位AI主持人进行分析讨论。

谷歌通过将其更新的免费深度研究功能的输出转换为AI音频播客来展示这一技术。这些音频摘要最初出现在NotebookLM平台上。值得注意的是,与其他AI生成内容一样,这些音频内容可能包含不准确信息,用户在使用时应保持适当的判断力。

目前,Audio Overviews功能仅支持英语,可通过网络和移动平台访问。用户可以下载和分享创建的音频文件。

Gemini生态系统持续扩展

自今年年初以来,谷歌一直在积极扩展其Gemini生态系统。最近的更新包括:

  • Gemini Live增加了视频和屏幕共享支持,率先在三星Galaxy S24/S25和Pixel9设备上推出
  • 谷歌计划用Gemini取代Google Assistant作为Android的默认AI助手
  • 推出了三种新的模型变体:Gemini2.0Flash(基础模型)、Flash Lite(经济高效版)和2.0Pro(具有扩展上下文处理能力)
  • 在欧盟、瑞士和英国以外的地区,Gemini现可访问用户的Google搜索历史记录,提供更具情境化的响应
  • 平台获得了用于生成和编辑图像以及理解YouTube视频的原生多模式功能

据谷歌官方消息,Canvas和Audio Overviews功能现已面向全球Gemini和Gemini Advanced用户开放。