L'infrastructure cloud a longtemps été conçue autour des humains qui cherchent, cliquent, défilent et streament de manière régulière et prévisible. Les agents IA se comportent différemment. Ils peuvent déclencher un raz-de-marée d'activité, en lançant plusieurs sous-agents qui interrogent des centaines de bases de données, recherchent des documents et appellent des API en quelques secondes, puis disparaissent aussi vite qu'ils sont arrivés.
Partant de ce constat, Amazon repense un élément central de son infrastructure cloud. Jeudi, AWS a lancé sa nouvelle génération d'OpenSearch Serverless, une base de données vectorielles et de recherche entièrement gérée – essentiellement un système pour stocker et récupérer des informations à grande échelle – spécialement conçue pour les charges de travail agentiques. AWS affirme que le nouveau système peut monter en charge instantanément lorsque les agents déclenchent des tâches et redescendre à zéro lorsqu'ils sont inactifs.
Ce lancement reflète une prise de conscience croissante dans l'industrie tech : l'infrastructure conçue à l'origine pour un Internet humain ne fonctionne pas aussi bien dans un monde de plus en plus peuplé d'agents.
Bien que les agents IA ne représentent encore qu'une part relativement faible de l'activité Internet, le trafic généré par les machines est déjà significatif et promet de croître. Cloudflare indique que les bots ont représenté 31 % du trafic HTTP global au cours des six derniers mois. Les crawlers IA, moteurs de recherche et assistants constituaient environ un quart de toutes les requêtes de bots sur cette période.
« Le trafic non humain dépassera le trafic humain quelque part au premier semestre 2027 », a déclaré Li Yi Ohlsen, chef de produit senior chez Cloudflare, à TechCrunch.
Lors de la conférence développeurs I/O de Google la semaine dernière, la société a annoncé que les utilisateurs pourront déléguer des tâches à des systèmes IA, comme rechercher des achats, réserver des voyages, naviguer sur le web et interagir avec des applications. Mais l'effet ne s'arrête pas aux agents IA grand public. Les entreprises déploient de plus en plus d'agents en interne et pour leurs clients, créant de nouveaux types de trafic machine en coulisses.
En conséquence, les fournisseurs de cloud et les entreprises d'infrastructure doivent composer avec l'adaptation de systèmes conçus pour les humains à un monde d'agents qui récupèrent constamment et de manière autonome des informations, invoquent des outils et génèrent du trafic machine à machine.
C'est là qu'intervient le nouvel OpenSearch Serverless d'AWS.
« Le timing est évident. Les agents passent de l'expérimentation à la production, et ils créent des schémas de trafic pour lesquels l'infrastructure précédente n'était tout simplement pas conçue », a déclaré Tia White, directrice générale d'Amazon OpenSearch Service, à TechCrunch. « Ils montent en charge sans prévenir, deviennent inactifs sans préavis, et les entreprises ont besoin d'une recherche qui suive sans payer pour des ressources de calcul vides ou inactives. »
Le changement technique clé de cette nouvelle génération est qu'elle dissocie le calcul du stockage, permettant au calcul de monter en charge en quelques secondes pour s'adapter aux pics de trafic des agents et de redescendre à zéro, de sorte que les clients paient 0 $ lorsque les agents sont inactifs.
« Auparavant, même dans notre version Serverless précédente, vous deviez avoir au moins une instance opérationnelle et en cours d'exécution car le stockage et le calcul étaient couplés », a déclaré White. « Vous ne pouviez pas simplement lancer automatiquement [le calcul] au rythme dont vous aviez besoin, donc vous aviez toujours des ressources de calcul inactives réservées pour votre charge de travail, que vous les utilisiez ou non. »
Imaginez que vous payiez toujours pour une place de parking, même lorsque vous ne l'utilisez pas. Avec le Serverless amélioré d'AWS, c'est plutôt comme payer pour une place de parking avec parcmètre.
Au lancement, OpenSearch Serverless s'intégrera nativement avec des plateformes de développement IA comme Vercel et Kiro, permettant aux développeurs de déployer des backends de recherche et vectoriels prêts pour la production pour les agents sans gérer l'infrastructure.
Ce changement émerge dans toute l'industrie du cloud. Databricks et Snowflake se repositionnent comme des systèmes de mémoire et de récupération IA pour les données d'entreprise. Microsoft a déployé des mises à jour d'Azure conçues pour gérer les pics d'agents IA et partager la mémoire entre agents. Cloudflare, dans la même veine qu'Amazon, a lancé le mois dernier une infrastructure visant à donner aux agents des environnements persistants.