微软AI首席执行官穆斯塔法·苏莱曼近日在《麻省理工科技评论》上宣称,计算技术正处于“接近人类水平的智能体”的门槛上。这很棒,前提是我们能搞清楚如何防止它们不小心把你的私人医疗记录通过邮件发给陌生人。

根据Databricks的《AI智能体现状报告》,只有19%的组织部署了AI智能体,而且大多规模有限。Databricks AI负责人克雷格·威利告诉ZDNET,CFO们有三个担忧:控制、质量和成本。基本上就是他们对青春期孩子的那些担忧,只不过多了数据泄露。

威利的第一条最佳实践是治理——具体来说,就是控制智能体可以访问哪些数据。他提到了女性健康应用Flow,该应用拥有7500万用户,并且担心把一个人的排卵期图表和另一个人的搞混。“他们最不希望的就是某个应用用户收到包含其他用户信息的回复,”威利说,这话说得轻描淡写,仿佛他从未见过数据泄露的头条新闻。

资产管理公司富兰克林坦伯顿在投资组合报告方面也面临类似挑战。没人想收到财务顾问发来的邮件,开头写着“亲爱的客户,这是别人的净资产”。威利强调,数据分割必须“确定性地强制执行”,而不能仅仅在提示中建议——因为AI就像一个分心的实习生,会走阻力最小的路径。

第二个实践是评估。当Flow的开发者需要确保准确性时,他们没有让程序员判断输出,而是请了真正的医生。“软件程序员编写所谓的编排系统,”威利解释说,“但由医生来判断‘这个回复需要额外的背景或色彩’。”评估应该是持续的,不仅要检查最终答案,还要检查智能体思考的每一个中间步骤。这样做的公司将智能体投入生产的可能性是其他公司的六倍——这要么是对评估的肯定,要么是对其他人的严厉控诉。

第三个担忧是成本,这基本上是把前两件事做对后的奖励。“一旦你能做到这两件事,老实说,剩下的就是实施细节了,”威利说。但成本必须提前考虑:“这是否是我们今天能在合理成本范围内解决的问题?假设我们能解决,它真的能推动公司的发展吗?”

威利建议从小处着手。便利店连锁7-Eleven为服务技术人员构建了一个“超级助手”,可以访问大量设备文档,减少了打电话问朋友“你见过这个问题吗?”的需求。结果:首次修复率提高了25%,维修时间减少了40%。贝勒大学使用智能体审查与潜在学生的通话录音,分析人类笔记员不可避免地会遗漏的决策因素。

富兰克林坦伯顿的投资组合分析自动化发现了超过1500万美元的新产品机会——大概是通过注意到人类太忙而忽略的客户投资组合缺口。

威利将当前智能体AI的状态比作“相当于2001年的网络,公司们投资于网页,但还不完全理解这一切的目的”。关键要点:先把数据整理好。“如果你的数据状态良好,我们今天下午就能构建并部署一个智能体系统,”威利说。“如果你的数据状态糟糕,那么真正的问题就是我们需要多长时间才能把数据整理好。”

因此,通往接近人类水平的智能体的道路是由干净的数据、严格的评估以及永恒的希望铺就的——希望你的AI不会不小心把你的最深秘密泄露给陌生人。欢迎来到未来。