在与Anthropic和OpenAI等生成式AI巨头的激烈竞争中,谷歌宣布对其AI聊天机器人Gemini进行全面升级。此次更新聚焦于提升平台性能并扩大其可用范围,让我们一起来看看有哪些重要变化。

多语言支持,全球覆盖

从本周四开始,Gemini1.5Flash(谷歌5月发布的轻量级多模式模型)将在网络和移动设备上支持40种语言,覆盖约230个国家和地区。谷歌表示,Gemini1.5Flash在质量和响应速度方面都有显著提升,尤其是在推理和图像理解方面。

这一升级不仅提高了用户体验,也可能降低谷歌的运营成本。Gemini1.5Flash被描述为Gemini1.5Pro的"精简版"和高效版,专为"窄带"、"高频"生成式AI工作负载而设计。

QQ截图20240726093143.png

来源:google

上下文窗口扩展,文件上传功能

除了新的基础模型,谷歌还将Gemini的上下文窗口扩展到32,000个标记,相当于约24,000个单词(或48页文本)。这意味着Gemini可以处理更长的文本,提供更连贯的对话体验。

更值得注意的是,谷歌即将为所有Gemini用户开放从Google Drive和本地设备上传文件的功能。用户可以上传学习资料,让Gemini创建练习题,甚至分析数据文件并生成可视化图表。

 提高透明度,减少"幻觉"

为了应对AI模型可能产生的"幻觉"(即编造虚假信息),谷歌正在测试一项新功能:在Gemini生成的某些答案下方显示相关网页内容的链接。这一举措旨在提高信息的可靠性和透明度。

更广泛的应用场景

谷歌正在将Gemini功能扩展到更多领域:

1. Messages应用集成:Gemini功能将在欧洲经济区(EEA)、英国和瑞士推出,并支持法语、波兰语和西班牙语等新增语言。

2. 手机应用推广:Gemini手机应用将在更多国家推出。

3. 面向青少年开放:Gemini将在全球范围内向青少年开放使用,同时推出专门的入职流程和"AI素养指南"。

谷歌此次对Gemini的全面升级,体现了其在AI领域的雄心和决心。通过提升性能、扩大语言支持、增加新功能并向更广泛的用户群开放,谷歌正努力在竞争激烈的AI市场中保持领先地位。