近日,一项由研究员纳Naphtali Deutsch进行的调查引发了人们的关注。他通过扫描网络发现,数百个开源的大型语言模型(LLM)构建服务器和几十个向量数据库正在泄露大量敏感信息。这些信息的泄露源于许多公司在急于整合人工智能(AI)到工作流程中时,往往忽视了相关工具的安全性。
图源备注:图片由AI生成,图片授权服务商Midjourney
Flowise 是一款低代码的工具,用户可以借此创建各种 LLM 应用,无论是客服机器人,还是数据生成和提取工具。尽管大多数 Flowise 服务器设置了密码保护,但仅仅依靠密码并不能确保安全。
Deutsch提到,早在今年,就有研究人员发现了 Flowise 的身份验证绕过漏洞,只需将程序 API 端点的几个字符大写,便可以轻松触发此漏洞。利用这个漏洞,Deutsch成功破解了438个 Flowise 服务器,结果发现其中存储了 GitHub 访问token、OpenAI API 密钥、Flowise 密码和 API 密钥等敏感数据,甚至还有与 Flowise 应用相关的配置和提示信息。
除了 Flowise,Deutsch还发现大约30个向量数据库没有任何身份验证检查,这些数据库中存储了明显敏感的信息,包括某工程服务公司的私人邮件、某时尚公司的文件、某工业设备公司的客户个人信息和财务数据等。向量数据库的泄露风险更大,因为黑客不仅可以窃取数据,还能删除或破坏数据,甚至植入恶意软件,导致用户在使用 AI 工具时受到影响。
为了降低这些风险,Deutsch建议企业限制对所依赖的 AI 服务的访问,监控和记录与这些服务相关的活动,保护 LLM 应用传输的敏感数据,并在可能的情况下始终应用软件更新。
他强调,随着这些工具的普及,许多开发者并不具备足够的安全知识来进行合理的设置,安全性常常滞后于技术的发展。
划重点:
1. 🔒 数百个 LLM 和向量数据库泄露敏感信息,企业安全形势堪忧。
2. 💻 Flowise 工具存在身份验证绕过漏洞,已被黑客利用破解多台服务器。
3. 🛡️ 专家建议企业加强对 AI 服务的访问控制,定期监控和更新安全措施。