科技巨头谷歌的AI研究部门近日推出了Gemini AI模型的最新迭代——Gemini2.0Flash。这款新模型在性能上进行了显著提升,特别是在处理速度和多模态功能扩展方面。官方表示,全球 Gemini 用户可以通过在桌面和移动 Web 的模型下拉列表中选择2.0Flash 实验版来访问聊天优化版本,并且它很快就会在 Gemini 移动应用程序中提供。明年年初,会将 Gemini2.0扩展到更多 Google 产品。Gemini2.0Flash的一个关键发展是其增强的处理速度。谷歌表示,新模型的运行速度是前代Gemini1.5Pro的两倍,同时在各种基准测试中
随着生成式图像技术的迅速发展,创作者对图像输出的多样性、版权保护和视觉效果的需求日益增长。在这一背景下,NegToMe应运而生,为图像生成领域带来了颠覆性的创新。这项突破性技术通过图像驱动的对抗性指导方法,彻底突破了传统负面提示的局限。与基于文本的对抗性指导方法不同,NegToMe直接参考图像的视觉特征,实现精准、灵活的图像生成控制。技术的核心优势体现在多个维度。在多样性方面,NegToMe显著提升了生成图像的差异性,特别是在种族、性别和视觉特征处理上。更为
谷歌 AI 工作室与 Gemini API 近日联合推出了 “与谷歌搜索的实时连接” 功能,旨在帮助开发者通过整合谷歌搜索的实时数据,提升 AI 模型的响应准确性。随着这项更新,Gemini1.5模型可以从谷歌搜索中获取最新信息,从而增强回答的准确性和透明性。开发者可以通过谷歌 AI 工作室的 “工具” 部分直接访问这一功能,或在 Gemini API 中启用 “google_search_retrieval” 工具。“与谷歌搜索的实时连接” 功能目前在谷歌 AI 工作室的免费试用版中可用,而 Gemini API 的定价则定为每1000个带有实时连接的
在近日的财报电话会议上,谷歌首席执行官桑达尔・皮查伊透露了一个引人关注的消息:谷歌的 “ Project Astra” 计划预计至少要到2025年才能正式推出。这一项目的目标是开发出能够实现实时、多模态理解的 AI 应用和 “代理”,让人工智能能够更好地理解和互动周围的世界。 Project Astra的愿景非常大胆。皮查伊表示,谷歌正在努力创造一种体验,让 AI 不仅能 “看见” 周围的环境,还能进行推理。这意味着,未来的 AI 助手将不仅仅是简单的语音助手,而是能通过视觉识别和智能处理来回答