长期以来,云基础设施一直围绕人类设计——他们稳定且可预测地搜索、点击、滚动和流媒体。AI 代理的行为则不同。它们可以爆发出一波活动,瞬间启动多个子代理,查询数百个数据库、搜索文档、调用 API,然后像来时一样迅速消失。
基于这一前提,亚马逊正在重新设计其云基础设施的核心部分。周四,AWS 推出了下一代 OpenSearch Serverless,这是一个完全托管的搜索和向量数据库——本质上是一个大规模存储和检索信息的系统——专门为代理工作负载设计。AWS 表示,新系统可以在代理触发任务时立即扩展,并在空闲时缩减到零。
这一发布反映了科技行业日益增长的认识:最初为人类驱动的互联网设计的基础设施,在代理日益增多的世界中不再适用。
虽然 AI 代理仍只占互联网活动的一小部分,但机器生成的流量已经相当可观,并且有望增长。Cloudflare 表示,过去六个月中,机器人占 HTTP 总流量的 31%。在此期间,AI 爬虫、搜索引擎和助手约占所有机器人请求的四分之一。
“非人类流量将在 2027 年上半年某个时候超过人类流量,”Cloudflare 高级产品经理 Li Yi Ohlsen 告诉 TechCrunch。
在上周的 Google I/O 开发者大会上,该公司表示用户将能够将任务委托给 AI 系统,例如研究购买、预订旅行、浏览网页和与应用程序交互。但事情并不止于面向消费者的 AI 代理。企业越来越多地在内部和为客户部署代理,在幕后创造新型机器生成的流量。
因此,云提供商和基础设施公司一直在思考如何将为人设计的系统适应一个代理不断自主检索信息、调用工具并生成机器对机器流量的世界。
这就是 AWS 新 OpenSearch Serverless 的用武之地。
“时机很直接。代理正在从实验转向生产,它们产生的流量模式是以前的基础设施从未设计过的,”Amazon OpenSearch Service 总经理 Tia White 告诉 TechCrunch。“它们毫无征兆地激增,毫无通知地闲置,企业需要搜索跟上节奏,而不必为空闲计算付费。”
这一代的关键技术变化是它将计算与存储解耦,允许计算在几秒钟内扩展以适应代理流量突发,并缩减到零,因此客户在代理空闲时支付 0 美元。
“以前,即使在我们之前的 Serverless 版本中,你也必须至少有一个实例在运行,因为存储和计算是耦合的,”White 说。“你不能按需自动启动计算,所以你总是为工作负载预留空闲计算,无论你是否使用。”
可以把它想象成总是为停车位付费,即使你不在使用。使用 AWS 升级后的 Serverless,更像是为按小时计费的停车位付费。
在发布时,OpenSearch Serverless 将原生集成 Vercel 和 Kiro 等 AI 开发平台,因此开发人员可以为代理部署生产就绪的搜索和向量后端,而无需管理基础设施。
这种转变正在整个云行业出现。Databricks 和 Snowflake 正在将自己重新定位为企业数据的 AI 记忆和检索系统。微软推出了 Azure 更新,旨在处理 AI 代理突发并在代理之间共享内存。Cloudflare 与亚马逊类似,上个月推出了旨在为代理提供持久环境的基础设施。