微软在AI功能上砸了巨额资金,建设数据中心,从OpenAI、Anthropic等公司授权大语言模型,同时也在尝试自研替代品。目标——直接来自雷德蒙德组织架构的顶层——是将Windows和Microsoft 365打造成一个“代理操作系统”,能够完成那些让职场生活苦不堪言的任务:写备忘录、做演示文稿、组织会议、自动化日常琐事。
但这些投资见效了吗?开发者似乎对Claude Code和GitHub Copilot等工具很满意,但商业领域的代理却远没有那么能干。过去几周,我一直在尝试使用Microsoft 365和Windows中的AI功能处理日常工作。Copilot偶尔会闪现出一些能力,但更多时候,结果是一团糟:错误信息、幻觉,以及浪费时间死胡同。
几个月来,微软一直催我升级到新的Microsoft 365 Premium计划,该计划包含更高的AI使用限制和几个专属代理。本着科学精神,我付了10美元,将一个未使用的账户升级了一个月,以便试用它们。
我先从Analyst代理开始,给它一份我的家庭收支电子表格,请它帮忙改进设计。经过一番来回,它提出了一些有用的建议,比如收紧公式、合并重复表格、消除冗余页面,最后还加粗显示,提议仅用公式和数据透视表构建一个仪表盘。“如果你愿意,”Copilot告诉我,“我可以为你草拟一个干净的仪表盘布局(精确的单元格和区域),让你在约15分钟内构建完成。”我以为代理应该替我做这些工作?所以我问:“你能帮我实际创建Excel文件吗,还是得我自己做?”当然,它告诉我。只有一个微小的限制:我必须自己创建一个数据透视表,但这项任务不到10秒就能完成。一两分钟后,Copilot告诉我:“我已创建了修改后的工作簿。点击此处下载。”然后它给了我一个链接:[sandbox:/mnt/data/Personal_accounts_modified.xlsm]。就是那个链接,连方括号一起。它不可点击。“嗯——这是我的错,”Copilot承认。“那个‘沙盒路径’在你的界面中实际上不可点击,所以你无法下载。”几次尝试后,Copilot放弃了,解释说如果我在使用ChatGPT,文件链接可能有效,并建议我在Google Sheets中创建文件,然后给自己发一个链接。不知怎的,我不认为这是雷德蒙德的产品经理们所期望的。
接下来,我让Microsoft 365 Premium Researcher代理简明扼要地解释一下Microsoft 365 Premium的优缺点。我没想到会得到这样的回应:“为了确保我准确覆盖你的需求:你说的‘Microsoft 365 Premium’具体指哪个计划?A) Microsoft 365 Personal, B) Microsoft 365 Family, C) Microsoft 365 Business Premium, 还是 D) 比较消费者计划(Personal/Family)并简要提及Business Premium(仅当相关时)?”需要说明的是,我正在使用微软大力推广的产品的一个标志性功能,而它完全不知道我在说什么。在我提供了一个产品页面链接后,Copilot给出了一个相当平淡的第三方功能摘要。我不会称之为研究,而且它绝对不深入。
今天早上,我试图使用远程桌面客户端连接到办公室网络中的一台电脑,但遇到了证书错误:“服务器名称在证书中不正确。”自己排查了几分钟后,我决定尝试用Copilot来“氛围式系统管理”一下。“修复方法很简单,”Copilot自信地回答。我只需要强制VM内的Windows生成一个新的远程桌面证书。然后……