La infraestructura de la nube ha estado diseñada durante mucho tiempo para humanos que buscan, hacen clic, se desplazan y transmiten de manera constante y predecible. Los agentes de IA se comportan de manera diferente. Pueden desatar una oleada de actividad, generando múltiples subagentes que consultan cientos de bases de datos, buscan documentos y llaman a API en segundos, y luego desaparecen tan rápido como llegaron.
Bajo esa premisa, Amazon está rediseñando una pieza central de su infraestructura en la nube. El jueves, AWS lanzó su próxima generación de OpenSearch Serverless, una base de datos de búsqueda y vectores totalmente administrada (esencialmente un sistema para almacenar y recuperar información a escala) diseñada específicamente para cargas de trabajo de agentes. AWS dice que el nuevo sistema puede escalar instantáneamente cuando los agentes activan tareas y reducirse a cero cuando están inactivos.
El lanzamiento refleja una creciente toma de conciencia en toda la industria tecnológica: la infraestructura diseñada originalmente para un Internet impulsado por humanos no funciona tan bien en un mundo cada vez más poblado por agentes.
Si bien los agentes de IA aún representan una porción relativamente pequeña de la actividad en Internet, el tráfico generado por máquinas ya es significativo y está listo para crecer. Cloudflare dice que los bots representaron el 31% del tráfico HTTP total en los últimos seis meses. Los rastreadores de IA, motores de búsqueda y asistentes constituyeron aproximadamente una cuarta parte de todas las solicitudes de bots durante ese período.
"El tráfico no humano superará al tráfico humano en algún momento del primer semestre de 2027", dijo Li Yi Ohlsen, gerente senior de productos de Cloudflare, a TechCrunch.
En la conferencia de desarrolladores I/O de Google la semana pasada, la compañía dijo que los usuarios podrán comenzar a delegar tareas a sistemas de IA, como investigar compras, reservar viajes, navegar por la web e interactuar con aplicaciones. Pero la cosa no termina en los agentes de IA orientados al consumidor. Las empresas están implementando cada vez más agentes internamente y para sus clientes, creando nuevos tipos de tráfico generado por máquinas entre bastidores.
Como resultado, los proveedores de nube y las empresas de infraestructura han estado lidiando con cómo adaptar sistemas construidos para humanos a un mundo de agentes que recuperan información constantemente y de forma autónoma, invocan herramientas y generan tráfico máquina a máquina.
Ahí es donde entra el nuevo OpenSearch Serverless de AWS.
"El momento es sencillo. Los agentes están pasando de la experimentación a la producción, y crean patrones de tráfico para los que la infraestructura anterior simplemente no estaba diseñada", dijo Tia White, gerente general de Amazon OpenSearch Service, a TechCrunch. "Aumentan sin previo aviso, se vuelven inactivos sin notificación, y las empresas necesitan búsquedas que sigan el ritmo sin pagar por cómputo vacío o inactivo".
El cambio técnico clave con esta nueva generación es que desacopla el cómputo del almacenamiento, permitiendo que el cómputo escale en segundos para acomodar ráfagas de tráfico de agentes y se reduzca a cero, por lo que los clientes pagan $0 cuando los agentes están inactivos.
"Anteriormente, incluso en nuestra versión Serverless anterior, tenías que tener al menos una instancia operativa y en ejecución porque el almacenamiento y el cómputo estaban acoplados", dijo White. "No podías simplemente activar automáticamente [el cómputo] a la velocidad que necesitabas, por lo que siempre tenías cómputo inactivo reservado para tu carga de trabajo, lo estuvieras usando o no".
Piense en ello como pagar siempre por un espacio de estacionamiento, incluso cuando no lo está usando. Con el Serverless mejorado de AWS, es más como pagar por un estacionamiento con parquímetro.
En el lanzamiento, OpenSearch Serverless se integrará de forma nativa con plataformas de desarrollo de IA como Vercel y Kiro, para que los desarrolladores puedan implementar backends de búsqueda y vectores listos para producción para agentes sin administrar infraestructura.
El cambio está surgiendo en toda la industria de la nube. Databricks y Snowflake se están reposicionando como sistemas de memoria y recuperación de IA para datos empresariales. Microsoft ha lanzado actualizaciones de Azure diseñadas para manejar ráfagas de agentes de IA y compartir memoria entre agentes. Cloudflare, en una línea similar a Amazon, el mes pasado introdujo infraestructura destinada a dar a los agentes entornos persistentes.