L'infrastruttura cloud è stata a lungo progettata attorno a umani che cercano, cliccano, scorrono e fanno streaming in modo costante e prevedibile. Gli agenti AI si comportano diversamente. Possono scatenare un'ondata di attività, lanciando più sotto-agenti che interrogano centinaia di database, cercano documenti e chiamano API in pochi secondi, per poi scomparire con la stessa rapidità con cui sono arrivati.
Con questa premessa, Amazon sta riprogettando un pezzo fondamentale della sua infrastruttura cloud. Giovedì, AWS ha lanciato la sua prossima generazione di OpenSearch Serverless, un database di ricerca e vettori completamente gestito - essenzialmente un sistema per archiviare e recuperare informazioni su larga scala - progettato specificamente per carichi di lavoro agentici. AWS afferma che il nuovo sistema può scalare istantaneamente quando gli agenti attivano attività e ridimensionarsi a zero quando inattivo.
Il lancio riflette una crescente consapevolezza in tutta l'industria tech: l'infrastruttura originariamente progettata per un Internet guidato dagli umani non funziona altrettanto bene in un mondo sempre più popolato da agenti.
Sebbene gli agenti AI rappresentino ancora una porzione relativamente piccola dell'attività su Internet, il traffico generato dalle macchine è già significativo e destinato a crescere. Cloudflare afferma che i bot hanno rappresentato il 31% del traffico HTTP totale negli ultimi sei mesi. I crawler AI, i motori di ricerca e gli assistenti hanno costituito circa un quarto di tutte le richieste dei bot in quel periodo.
"Il traffico non umano supererà il traffico umano a metà del 2027," ha detto Li Yi Ohlsen, senior product manager di Cloudflare, a TechCrunch.
Alla conferenza I/O di Google la scorsa settimana, l'azienda ha detto che gli utenti potranno iniziare a delegare compiti ai sistemi AI, come ricercare acquisti, prenotare viaggi, navigare sul web e interagire con le app. Ma la cosa non si ferma agli agenti AI orientati al consumatore. Le aziende stanno sempre più implementando agenti internamente e per i loro clienti, creando nuovi tipi di traffico generato dalle macchine dietro le quinte.
Di conseguenza, i provider cloud e le aziende di infrastruttura hanno dovuto fare i conti con come adattare i sistemi costruiti per gli umani a un mondo di agenti che recuperano costantemente e autonomamente informazioni, invocano strumenti e generano traffico macchina-macchina.
È qui che entra in gioco il nuovo OpenSearch Serverless di AWS.
"Il tempismo è semplice. Gli agenti stanno passando dalla sperimentazione alla produzione e creano modelli di traffico per cui l'infrastruttura precedente semplicemente non era progettata," ha detto Tia White, general manager per Amazon OpenSearch Service, a TechCrunch. "Spuntano senza preavviso, diventano inattivi senza preavviso e le aziende hanno bisogno di una ricerca che stia al passo senza pagare per compute vuoto o inattivo."
Il cambiamento tecnico chiave con questa nuova generazione è che separa il compute dallo storage, permettendo al compute di scalare in secondi per gestire i picchi di traffico degli agenti e di ridimensionarsi a zero, così i clienti pagano $0 quando gli agenti sono inattivi.
"In precedenza, anche nella nostra versione Serverless precedente, dovevi avere almeno un'istanza operativa e in esecuzione perché storage e compute erano accoppiati," ha detto White. "Non potevi semplicemente avviare automaticamente [il compute] alla velocità necessaria, quindi avevi sempre compute inattivo riservato per il tuo carico di lavoro, che lo usassi o no."
Pensala come pagare sempre per un parcheggio, anche quando non lo usi. Con il Serverless aggiornato di AWS, è più come pagare per un parcheggio a pagamento.
Al lancio, OpenSearch Serverless si integrerà nativamente con piattaforme di sviluppo AI come Vercel e Kiro, così gli sviluppatori possono distribuire backend di ricerca e vettori pronti per la produzione per gli agenti senza gestire l'infrastruttura.
Il cambiamento sta emergendo in tutta l'industria cloud. Databricks e Snowflake si stanno riposizionando come sistemi di memoria e recupero AI per i dati aziendali. Microsoft ha rilasciato aggiornamenti ad Azure progettati per gestire i picchi degli agenti AI e condividere la memoria tra agenti. Cloudflare, in modo simile ad Amazon, il mese scorso ha introdotto un'infrastruttura mirata a dare agli agenti ambienti persistenti.