Die Cloud-Infrastruktur war lange Zeit auf Menschen ausgelegt, die in gleichmäßiger und vorhersehbarer Weise suchen, klicken, scrollen und streamen. KI-Agenten verhalten sich anders. Sie können eine Flut von Aktivitäten auslösen, mehrere Unteragenten starten, die in Sekundenschnelle Hunderte von Datenbanken abfragen, Dokumente durchsuchen und APIs aufrufen, um dann genauso schnell wieder zu verschwinden, wie sie gekommen sind.
Unter dieser Prämisse gestaltet Amazon einen Kernbestandteil seiner Cloud-Infrastruktur neu. Am Donnerstag startete AWS seine nächste Generation von OpenSearch Serverless, einer vollständig verwalteten Such- und Vektordatenbank – im Wesentlichen ein System zum Speichern und Abrufen von Informationen in großem Maßstab –, die speziell für agentische Workloads entwickelt wurde. AWS sagt, das neue System könne sofort hochskalieren, wenn Agenten Aufgaben auslösen, und bei Inaktivität auf null herunterskalieren.
Der Start spiegelt eine wachsende Erkenntnis in der gesamten Tech-Branche wider: Infrastruktur, die ursprünglich für ein von Menschen gesteuertes Internet entwickelt wurde, funktioniert in einer Welt, die zunehmend von Agenten bevölkert wird, nicht mehr so gut.
Obwohl KI-Agenten immer noch einen relativ kleinen Teil der Internetaktivität ausmachen, ist maschinell erzeugter Traffic bereits beträchtlich und wird weiter wachsen. Cloudflare gibt an, dass Bots in den letzten sechs Monaten 31 % des gesamten HTTP-Traffics ausmachten. KI-Crawler, Suchmaschinen und Assistenten machten in diesem Zeitraum etwa ein Viertel aller Bot-Anfragen aus.
„Nicht-menschlicher Traffic wird den menschlichen Traffic irgendwann in der ersten Hälfte des Jahres 2027 übersteigen“, sagte Li Yi Ohlsen, Senior Product Manager bei Cloudflare, gegenüber TechCrunch.
Auf der Google I/O-Entwicklerkonferenz letzte Woche sagte das Unternehmen, dass Nutzer Aufgaben an KI-Systeme delegieren können, wie das Recherchieren von Einkäufen, das Buchen von Reisen, das Surfen im Internet und die Interaktion mit Apps. Aber dabei bleibt es nicht bei verbraucherorientierten KI-Agenten. Unternehmen setzen zunehmend Agenten intern und für ihre Kunden ein, was hinter den Kulissen neue Arten von maschinell erzeugtem Traffic erzeugt.
Infolgedessen müssen Cloud-Anbieter und Infrastrukturunternehmen darüber nachdenken, wie sie Systeme, die für Menschen gebaut wurden, an eine Welt von Agenten anpassen können, die ständig und autonom Informationen abrufen, Tools aufrufen und Maschine-zu-Maschine-Traffic erzeugen.
Hier kommt AWS‘ neuer OpenSearch Serverless ins Spiel.
„Das Timing ist klar. Agenten bewegen sich vom Experimentieren in die Produktion und erzeugen Verkehrsmuster, für die die bisherige Infrastruktur einfach nicht ausgelegt war“, sagte Tia White, General Manager für Amazon OpenSearch Service, gegenüber TechCrunch. „Sie spiken ohne Vorwarnung, sie werden ohne Ankündigung inaktiv, und Unternehmen brauchen eine Suche, die mithält, ohne für leere oder untätige Rechenleistung zu bezahlen.“
Die wichtigste technische Änderung dieser neuen Generation ist, dass sie Rechenleistung von Speicher entkoppelt, sodass die Rechenleistung in Sekunden hochskaliert werden kann, um Agenten-Traffic-Spitzen zu bewältigen, und auf null herunterskalieren kann, sodass Kunden 0 $ zahlen, wenn Agenten inaktiv sind.
„Bisher musste man selbst in unserer vorherigen Serverless-Version mindestens eine Instanz betriebsbereit und laufend haben, weil Speicher und Rechenleistung gekoppelt waren“, sagte White. „Man konnte [Rechenleistung] nicht einfach automatisch in dem Tempo hochfahren, das man brauchte, also hatte man immer untätige Rechenleistung für seinen Workload reserviert, ob man sie nun nutzte oder nicht.“
Stellen Sie es sich vor wie immer für einen Parkplatz zu bezahlen, auch wenn Sie ihn nicht nutzen. Mit AWS‘ verbessertem Serverless ist es eher wie die Bezahlung eines Parkscheins.
Zum Start wird OpenSearch Serverless nativ mit KI-Entwicklungsplattformen wie Vercel und Kiro integriert, sodass Entwickler produktionsreife Such- und Vektor-Backends für Agenten bereitstellen können, ohne Infrastruktur verwalten zu müssen.
Der Wandel zeichnet sich in der gesamten Cloud-Branche ab. Databricks und Snowflake positionieren sich neu als KI-Speicher- und Abrufsysteme für Unternehmensdaten. Microsoft hat Updates für Azure veröffentlicht, die darauf ausgelegt sind, KI-Agenten-Spitzen zu bewältigen und Speicher zwischen Agenten zu teilen. Cloudflare hat letztes Monat in ähnlicher Weise wie Amazon eine Infrastruktur eingeführt, die darauf abzielt, Agenten eine persistente Umgebung zu bieten.