OpenAI 为 ChatGPT 推出了一项新功能,据称能提供额外保护,抵御提示注入攻击——那些令人愉悦的小场景,恶意聊天机器人指令隐藏在网页和其他内容源中,就等着诱骗你的 AI 泄露秘密。

所谓的“锁定模式”将禁用几个关键功能以确保安全:实时网页浏览(所以你只能使用缓存内容)、从网络检索和显示图像(你仍然可以生成图像,因为那没问题)、深度研究和代理模式。没有什么比关掉让产品有用的功能更能体现“安全”了。

公司坦诚地承认,即使启用了锁定模式,ChatGPT 仍可能受到提示注入攻击。公司指出,这些攻击“可能出现在缓存的网页内容或上传的文件中,并且仍可能影响响应的行为或准确性。”换句话说:这是创可贴,不是解药。

但 OpenAI 表示,目标是降低在此过程中共享敏感数据的可能性。这有点像说安全带能降低车祸受伤的可能性——没错,但你宁愿不测试它。

OpenAI 澄清说:“锁定模式并非面向所有人。它专为处理敏感数据并希望获得更严格保护以防止与提示注入相关的数据泄露风险的个人和组织设计。”所以,基本上,它是为那些不希望机密备忘录出现在某个黑客聊天记录中的人准备的。

公司表示,目前正在向自助服务的 ChatGPT 商业账户以及符合条件的个人账户推出锁定模式。没有什么比一个仍在推出中的功能更能体现“安全 AI”了,而互联网依然是那个互联网。