AWS、クラウドインフラを再設計——人間はもはやインターネットの主役ではない

クラウドインフラは長い間、検索し、クリックし、スクロールし、ストリーミングする人間のために設計されてきた。AIエージェントは違う。彼らは活動のうねりを解き放ち、複数のサブエージェントを立ち上げ、数百のデータベースにクエリを実行し、ドキュメントを検索し、APIを呼び出し、数秒で消え去る。

その前提のもと、Amazonはクラウドインフラの中核部分を再設計している。木曜日、AWSは次世代のOpenSearch Serverlessを発表した。これは、エージェントのワークロード向けに特別に設計された、フルマネージドの検索・ベクターデータベース（大規模な情報の保存と取得のためのシステム）だ。AWSによると、新しいシステムはエージェントがタスクをトリガーすると即座にスケールアップし、アイドル時にはゼロまでスケールダウンできる。

この発表は、テクノロジー業界全体で広がる認識を反映している。人間中心のインターネット向けに設計されたインフラは、エージェントが増え続ける世界ではうまく機能しない。

AIエージェントはまだインターネット活動の比較的小さな部分を占めるに過ぎないが、機械生成トラフィックはすでに重要であり、成長が見込まれている。Cloudflareによると、過去6ヶ月間でボットがHTTPトラフィック全体の31%を占めた。そのうちAIクローラー、検索エンジン、アシスタントが約4分の1を占めた。

「非人間トラフィックは2027年前半に人間トラフィックを超えるでしょう」とCloudflareのシニアプロダクトマネージャー、Li Yi Ohlsen氏はTechCrunchに語った。

先週のGoogle I/Oデベロッパーカンファレンスで、同社はユーザーが購入のリサーチ、旅行の予約、ウェブの閲覧、アプリとのやり取りなどのタスクをAIシステムに委任できるようになると発表した。しかし、消費者向けAIエージェントだけではない。企業は内部および顧客向けにエージェントを導入し、舞台裏で新たな種類の機械生成トラフィックを生み出している。

その結果、クラウドプロバイダーやインフラ企業は、人間向けに構築されたシステムを、常に自律的に情報を取得し、ツールを呼び出し、機械間トラフィックを生成するエージェントの世界に適応させる方法を模索している。

そこで登場するのがAWSの新しいOpenSearch Serverlessだ。

「タイミングは単純です。エージェントは実験から本番へ移行しており、従来のインフラでは想定されていなかったトラフィックパターンを生み出しています」とAmazon OpenSearch Serviceのゼネラルマネージャー、Tia White氏はTechCrunchに語った。「警告なしにスパイクし、通知なしにアイドル状態になり、企業は空のコンピュートやアイドルコンピュートに支払うことなく、それに対応できる検索を必要としています。」

この新世代の主要な技術的変更点は、コンピュートをストレージから分離したことだ。これにより、コンピュートはエージェントのトラフィックバーストに対応するために数秒でスケールアップし、ゼロまでスケールダウンできるため、顧客はエージェントがアイドル状態のときに0ドルを支払う。

「以前のServerlessバージョンでも、ストレージとコンピュートが結合していたため、少なくとも1つのインスタンスを稼働させておく必要がありました」とWhite氏は言う。「必要な速度で自動的にコンピュートを立ち上げることができず、使用していなくてもワークロード用にアイドルコンピュートを予約しておく必要がありました。」

これは、駐車スペースを常に支払っているようなものだ。AWSのアップグレードされたServerlessでは、メーター制の駐車スペースを支払うようなものだ。

ローンチ時、OpenSearch ServerlessはVercelやKiroなどのAI開発プラットフォームとネイティブに統合され、開発者はインフラを管理することなく、エージェント向けの本番対応検索・ベクターバックエンドをデプロイできる。

このシフトはクラウド業界全体で現れている。DatabricksとSnowflakeは、エンタープライズデータ向けのAIメモリおよび検索システムとして自社を再位置づけている。Microsoftは、AIエージェントのバーストを処理し、エージェント間でメモリを共有するためのAzureのアップデートを展開した。CloudflareもAmazonと同様に、先月エージェントに永続的な環境を提供するインフラを導入した。

AWS、クラウドインフラを再設計——人間はもはやインターネットの主役ではない

ニュースをメールで。