A infraestrutura de nuvem foi projetada por muito tempo em torno de humanos que pesquisam, clicam, rolam e fazem streaming de forma constante e previsível. Agentes de IA se comportam de maneira diferente. Eles podem desencadear uma onda de atividade, criando vários subagentes que consultam centenas de bancos de dados, pesquisam documentos e chamam APIs em segundos, e depois desaparecem tão rápido quanto chegaram.
Sob essa premissa, a Amazon está redesenhando uma peça central de sua infraestrutura de nuvem. Na quinta-feira, a AWS lançou sua próxima geração do OpenSearch Serverless, um banco de dados de busca e vetores totalmente gerenciado — essencialmente um sistema para armazenar e recuperar informações em escala — projetado especificamente para cargas de trabalho de agentes. A AWS diz que o novo sistema pode escalar instantaneamente quando agentes acionam tarefas e reduzir a zero quando ociosos.
O lançamento reflete uma percepção crescente em toda a indústria de tecnologia: a infraestrutura originalmente projetada para uma internet movida por humanos não funciona tão bem em um mundo cada vez mais povoado por agentes.
Embora os agentes de IA ainda representem uma parcela relativamente pequena da atividade na internet, o tráfego gerado por máquinas já é significativo e deve crescer. A Cloudflare diz que bots representaram 31% de todo o tráfego HTTP nos últimos seis meses. Rastreadores de IA, mecanismos de busca e assistentes representaram cerca de um quarto de todas as solicitações de bots nesse período.
“O tráfego não humano excederá o tráfego humano em algum momento do primeiro semestre de 2027”, disse Li Yi Ohlsen, gerente sênior de produtos da Cloudflare, ao TechCrunch.
Na conferência de desenvolvedores I/O do Google na semana passada, a empresa disse que os usuários poderão começar a delegar tarefas a sistemas de IA, como pesquisar compras, reservar viagens, navegar na web e interagir com aplicativos. Mas a coisa não para nos agentes de IA voltados ao consumidor. Empresas estão cada vez mais implantando agentes internamente e para seus clientes, criando novos tipos de tráfego gerado por máquinas nos bastidores.
Como resultado, provedores de nuvem e empresas de infraestrutura têm se debruçado sobre como adaptar sistemas construídos para humanos a um mundo de agentes que estão constantemente e autonomamente recuperando informações, invocando ferramentas e gerando tráfego máquina a máquina.
É aí que entra o novo OpenSearch Serverless da AWS.
“O timing é direto. Agentes estão saindo da experimentação para a produção, e eles criam padrões de tráfego para os quais a infraestrutura anterior simplesmente não foi projetada”, disse Tia White, gerente geral do Amazon OpenSearch Service, ao TechCrunch. “Eles disparam sem aviso, ficam ociosos sem notificação, e as empresas precisam de busca que acompanhe sem pagar por computação vazia ou ociosa.”
A principal mudança técnica com esta nova geração é que ela desacopla computação de armazenamento, permitindo que a computação escale em segundos para acomodar picos de tráfego de agentes e reduza a zero, para que os clientes paguem $0 quando os agentes estão ociosos.
“Anteriormente, mesmo em nossa versão Serverless anterior, você precisava ter pelo menos uma instância operacional e rodando porque armazenamento e computação eram acoplados”, disse White. “Você não conseguia simplesmente aumentar [a computação] automaticamente na taxa necessária, então você sempre tinha computação ociosa reservada para sua carga de trabalho, estivesse usando ou não.”
Pense nisso como sempre pagar por uma vaga de estacionamento, mesmo quando não a está usando. Com o Serverless atualizado da AWS, é mais como pagar por uma vaga de estacionamento com parquímetro.
No lançamento, o OpenSearch Serverless se integrará nativamente com plataformas de desenvolvimento de IA como Vercel e Kiro, para que desenvolvedores possam implantar backends de busca e vetores prontos para produção para agentes sem gerenciar infraestrutura.
A mudança está surgindo em toda a indústria de nuvem. Databricks e Snowflake estão se reposicionando como sistemas de memória e recuperação de IA para dados empresariais. A Microsoft lançou atualizações no Azure projetadas para lidar com picos de agentes de IA e compartilhar memória entre agentes. A Cloudflare, de forma similar à Amazon, no mês passado introduziu infraestrutura voltada a dar aos agentes ambientes persistentes.