Infrastruktura chmurowa od dawna była projektowana z myślą o ludziach, którzy wyszukują, klikają, przewijają i streamują w stały i przewidywalny sposób. Agenci AI zachowują się inaczej. Potrafią wywołać falę aktywności, uruchamiając wiele pod-agentów, które w ciągu sekund przeszukują setki baz danych, dokumenty i wywołują API, a potem znikają równie szybko, jak się pojawiły.
W związku z tym Amazon przeprojektowuje kluczowy element swojej infrastruktury chmurowej. W czwartek AWS uruchomił nową generację OpenSearch Serverless – w pełni zarządzaną wyszukiwarkę i bazę wektorową, czyli system do przechowywania i wyszukiwania informacji na dużą skalę – zaprojektowaną specjalnie dla obciążeń agentowych. AWS twierdzi, że nowy system może natychmiast skalować się w górę, gdy agenci uruchamiają zadania, i skalować w dół do zera, gdy są bezczynni.
Premiera odzwierciedla rosnące uświadomienie w całej branży technologicznej: infrastruktura pierwotnie zaprojektowana dla internetu sterowanego przez ludzi nie działa tak dobrze w świecie coraz bardziej zaludnionym przez agentów.
Choć agenci AI wciąż stanowią stosunkowo niewielką część aktywności internetowej, ruch generowany przez maszyny jest już znaczący i ma wzrosnąć. Cloudflare podaje, że boty odpowiadały za 31% całkowitego ruchu HTTP w ciągu ostatnich sześciu miesięcy. Crawlery AI, wyszukiwarki i asystenci stanowili około jednej czwartej wszystkich żądań botów w tym okresie.
„Ruch nie-ludzki przekroczy ruch ludzki gdzieś w pierwszej połowie 2027 roku” – powiedział Li Yi Ohlsen, starszy menedżer produktu w Cloudflare, dla TechCrunch.
Na konferencji deweloperskiej Google I/O w zeszłym tygodniu firma ogłosiła, że użytkownicy będą mogli zacząć delegować zadania systemom AI, takie jak badanie zakupów, rezerwacja podróży, przeglądanie sieci i interakcja z aplikacjami. Ale to nie koniec – agenci AI skoncentrowani na konsumentach. Przedsiębiorstwa coraz częściej wdrażają agentów wewnętrznie i dla swoich klientów, tworząc nowe rodzaje ruchu generowanego przez maszyny za kulisami.
W rezultacie dostawcy chmury i firmy infrastrukturalne zastanawiają się, jak dostosować systemy zbudowane dla ludzi do świata agentów, którzy stale i autonomicznie pobierają informacje, wywołują narzędzia i generują ruch maszyna-maszyna.
Tu właśnie pojawia się nowy OpenSearch Serverless od AWS.
„Czas jest oczywisty. Agenci przechodzą z eksperymentów do produkcji i tworzą wzorce ruchu, do których poprzednia infrastruktura po prostu nie była zaprojektowana” – powiedziała Tia White, dyrektor generalna Amazon OpenSearch Service, dla TechCrunch. „Skaczą bez ostrzeżenia, przechodzą w stan bezczynności bez powiadomienia, a przedsiębiorstwa potrzebują wyszukiwania, które nadąża bez płacenia za puste lub bezczynne zasoby obliczeniowe”.
Kluczową zmianą techniczną w tej nowej generacji jest oddzielenie mocy obliczeniowej od pamięci masowej, co pozwala na skalowanie mocy obliczeniowej w górę w ciągu sekund, aby obsłużyć skoki ruchu agentów, i skalowanie w dół do zera, dzięki czemu klienci płacą 0 $, gdy agenci są bezczynni.
„Wcześniej, nawet w naszej poprzedniej wersji Serverless, trzeba było mieć co najmniej jedną instancję działającą, ponieważ pamięć masowa i moc obliczeniowa były ze sobą powiązane” – powiedziała White. „Nie można było po prostu automatycznie uruchomić [mocy obliczeniowej] w tempie, w jakim było to potrzebne, więc zawsze miałeś zarezerwowane bezczynne zasoby obliczeniowe dla swojego obciążenia, niezależnie od tego, czy z nich korzystałeś, czy nie”.
Pomyśl o tym jak o ciągłym płaceniu za miejsce parkingowe, nawet gdy go nie używasz. Z ulepszonym Serverless od AWS jest to bardziej jak płacenie za miejsce parkingowe z licznikiem.
Na starcie OpenSearch Serverless będzie natywnie integrować się z platformami do tworzenia AI, takimi jak Vercel i Kiro, dzięki czemu deweloperzy będą mogli wdrażać gotowe do produkcji backendy wyszukiwania i wektorowe dla agentów bez zarządzania infrastrukturą.
To przesunięcie pojawia się w całej branży chmurowej. Databricks i Snowflake pozycjonują się jako systemy pamięci AI i wyszukiwania dla danych korporacyjnych. Microsoft wprowadził aktualizacje Azure zaprojektowane do obsługi skoków agentów AI i współdzielenia pamięci między agentami. Cloudflare, podobnie jak Amazon, w zeszłym miesiącu wprowadził infrastrukturę mającą na celu zapewnienie agentom trwałych środowisk.