Infrastructura cloud a fost mult timp proiectată în jurul oamenilor care caută, dau click, derulează și fac streaming într-un mod constant și previzibil. Agenții AI se comportă diferit. Ei pot declanșa un val de activitate, lansând mai mulți subagenți care interoghează sute de baze de date, caută documente și apelează API-uri în câteva secunde, apoi dispar la fel de repede cum au apărut.
Pe această premisă, Amazon redesenează o parte centrală a infrastructurii sale cloud. Joi, AWS a lansat noua generație de OpenSearch Serverless, o bază de date vectorială și de căutare complet gestionată – practic un sistem pentru stocarea și regăsirea informațiilor la scară largă – proiectată special pentru sarcinile agentice. AWS spune că noul sistem se poate scala instantaneu atunci când agenții declanșează sarcini și se poate reduce la zero când este inactiv.
Lansarea reflectă o realizare tot mai mare în industria tech: infrastructura proiectată inițial pentru un internet condus de oameni nu funcționează la fel de bine într-o lume populată tot mai mult de agenți.
Deși agenții AI reprezintă încă o parte relativ mică din activitatea pe internet, traficul generat de mașini este deja semnificativ și este pe cale să crească. Cloudflare spune că roboții au reprezentat 31% din traficul HTTP total în ultimele șase luni. Crawlerele AI, motoarele de căutare și asistenții au constituit aproximativ un sfert din toate cererile de roboți în acea perioadă.
„Traficul non-uman va depăși traficul uman cândva în prima jumătate a anului 2027”, a declarat Li Yi Ohlsen, senior product manager la Cloudflare, pentru TechCrunch.
La conferința pentru dezvoltatori I/O de săptămâna trecută, Google a spus că utilizatorii vor putea începe să delege sarcini sistemelor AI, cum ar fi cercetarea achizițiilor, rezervarea călătoriilor, navigarea pe web și interacțiunea cu aplicațiile. Dar lucrurile nu se opresc la agenții AI orientați către consumatori. Întreprinderile implementează din ce în ce mai mult agenți intern și pentru clienții lor, creând noi tipuri de trafic generat de mașini în culise.
Ca urmare, furnizorii de cloud și companiile de infrastructură s-au confruntat cu necesitatea de a adapta sistemele construite pentru oameni la o lume a agenților care recuperează constant și autonom informații, invocă instrumente și generează trafic mașină-la-mașină.
Aici intervine noul OpenSearch Serverless de la AWS.
„Momentul este simplu. Agenții trec de la experimentare la producție și creează modele de trafic pentru care infrastructura anterioară pur și simplu nu a fost proiectată”, a declarat Tia White, director general pentru Amazon OpenSearch Service, pentru TechCrunch. „Ei au vârfuri fără avertisment, devin inactivi fără notificare, iar întreprinderile au nevoie de căutare care să țină pasul fără a plăti pentru calcul inactiv sau gol.”
Schimbarea tehnică cheie cu această nouă generație este că decuplează calculul de stocare, permițând calculului să se scaleze în câteva secunde pentru a face față vârfurilor de trafic ale agenților și să se reducă la zero, astfel încât clienții plătesc 0 dolari când agenții sunt inactivi.
„Anterior, chiar și în versiunea noastră Serverless anterioară, trebuia să ai cel puțin o instanță operațională și în funcțiune, deoarece stocarea și calculul erau cuplate”, a spus White. „Nu puteai să pornești automat [calculul] la rata de care aveai nevoie, așa că aveai întotdeauna calcul inactiv rezervat pentru sarcina ta, indiferent dacă îl foloseai sau nu.”
Gândește-te ca și cum ai plăti întotdeauna pentru un loc de parcare, chiar și atunci când nu îl folosești. Cu Serverless-ul îmbunătățit de la AWS, este mai degrabă ca și cum ai plăti pentru un loc de parcare cu taxare la oră.
La lansare, OpenSearch Serverless se va integra nativ cu platforme de dezvoltare AI precum Vercel și Kiro, astfel încât dezvoltatorii să poată implementa back-end-uri de căutare și vectoriale gata de producție pentru agenți, fără a gestiona infrastructura.
Schimbarea se profilează în întreaga industrie cloud. Databricks și Snowflake se repoziționează ca sisteme de memorie și regăsire AI pentru datele întreprinderilor. Microsoft a lansat actualizări pentru Azure menite să gestioneze vârfurile agenților AI și să partajeze memoria între agenți. Cloudflare, într-o notă similară cu Amazon, a introdus luna trecută o infrastructură menită să ofere agenților medii persistente.