Next'25 速報 - GKE 10 周年!アップデート情報まとめ
はじめに
現在ラスベガスで開催されている Google Cloud の旗艦イベント「Google Cloud NEXT'25(以下、Next'25)」に現地参加中の kazz / 小堀内 / Shanks / 岸本 です。
Google Cloud NEXT'25 で発表された 最新情報 を現地からお届けしています。
GKE 10周年!
今年、Google Kubernetes Engine は誕生から 10 周年を迎えました!
Next'25 のセッション「GKE turns 10 and looks to the future of Kubernetes」では、Google Cloud のマネージド Kubernetes として、あらゆる業界のミッションクリティカルなワークロードを支えてきた GKE の歩みと、これからの展望が紹介されました。
本記事では、紹介されたアップデート情報を中心に、セッションの内容をご紹介いたします。
オートスケーリングに関するアップデート情報
In Place Pod Resize
Kubernetes の長年の課題であった、ポッドの再起動なしでのリソース (CPU/メモリ) 要求量の変更 を可能にする機能です。
これまで Vertical Pod Autoscaler (VPA) は再起動を伴うため、適用できるワークロードが限られていました。本機能により、VPA がリアルタイム性が求められるワークロードにも適用しやすくなります。例えば、起動時に多くの CPU を必要とする Java アプリケーションに対し、アノテーションで起動時のみ CPU をブーストし、起動完了後にリソース要求量を下げるといった運用が可能になります (Cloud Run の CPU ブースト機能に類似)。これにより、リソース使用率の最適化とコスト削減が大きく進むことが期待されます。「ほぼ自律的なポッド」の実現に近づく一歩と言えるでしょう。
利用可能時期: GKE Autopilot 1.33 以降で Alpha/Beta として利用可能になる見込みです (2025年4月末目標)。
Container Optimized Compute
最適化されたノードイメージ、スケジューリングロジックの改善、コンポーネントの事前準備などにより、ポッドのスケジュール割り当てやノードの起動時間を劇的に高速化する技術です。
セッションのデモでは、負荷に応じて 1 レプリカから 10 レプリカへのスケールアップが わずか 8秒 で完了しました (従来は 90秒以上)。これにより、急な負荷変動に備えた過剰なリソース確保 (オーバープロビジョニング) や、必要となるレプリカ数を大幅に削減でき、コスト効率と応答性の向上が期待できます。特にバースト的なワークロードへの対応力が向上します。
利用可能時期: GKE Autopilot (1.32 以降) でデフォルトで利用可能です。GKE Standard でも 2025年後半に利用可能になる予定です。
最適化された Horizontal Pod Autoscaler
GKE はオープンソースの HPA をそのまま使うのではなく、独自の最適化を施した HPA を提供しています。制御ループやメトリクスの精度が最適化されています。
これにより負荷変動に対して、より迅速かつ安定したスケーリング (スケールアップ/ダウン) が可能となります。これにより、リソースを無駄なく、かつパフォーマンスを維持しながら利用できます。
マルチクラスターと運用効率の向上
Extended チャンネルの追加
GKE のリリースチャンネルに、標準サポート期間終了後も追加で 10ヶ月間のサポート (セキュリティパッチ等) を提供する Extended チャンネルが追加されました。
やむを得ない事情ですぐにアップグレードできない場合でも、猶予期間を持つことができるようになります。
コントロールプレーンの最適化
GKE のコントロールプレーンは、etcd から Google 独自の分散データベースである Spanner へ移行されています。
この最適化により、クラスタ規模が大きくなってもコントロールプレーンのパフォーマンスと信頼性が維持されます。Google が大規模運用で直面した課題を解決してきた結果、ユーザーは GKE 上で安心して大規模ワークロードを実行できます。実際に数千ノードを超えるクラスタは珍しくなく、1万ノード規模のクラスタも運用されています。
Rollout Sequencing
複数の GKE クラスタ (フリート) に対するアップグレードを、段階的に、かつ条件に基づいて自動実行する機能です。
クラスタグループごとにアップグレードを行い、次のグループに進む前に特定の条件 (待機時間、主要アプリケーションメトリクスの正常性など) を設定できます。これにより、複雑なスクリプトを組むことなく、安全なカナリアリリースのような段階的な展開が可能になります。
Custom Compute Class
ワークロードが必要とする VM タイプやコスト要件に応じて、利用する VM の種類と優先順位をカスケード式に指定できる機能です。
例えば、「まず低コストな Spot N4 を試み、なければ Spot C4、それでもなければ Standard N4、最終的には予約済みリソースへ」といった柔軟な設定が可能です。在庫状況に応じて自動でフォールバックし、さらに優先度の高い (低コストな) インベントリが利用可能になれば自動でそちらへ移行 (フェイルフォワード) するため、コストを最適化しつつ、可用性を確保できます。アクセラレータに対しても、コミットメントや予約済みインスタンスを優先的に使用する設定が可能です。
Multi-Cluster Orchestrator
KubeCon EU 2025 で Google、Microsoft、AWS などが共同で発表した、複数の Kubernetes クラスタにまたがる Pod やジョブのデプロイとスケーリングを一元管理するための標準仕様およびその GKE 実装です。
単一の API を通じて、アプリケーションのレプリカを複数のクラスタ (異なるリージョンを含む) に動的に分散配置できます。これにより、アプリケーションの回復力向上や、リージョン間のキャパシティ確保 (例えば、特定のリージョンで GPU が不足している場合に他リージョンを利用する) に役立ちます。オープンソース標準であるため、ベンダーロックインの心配も少ないです。
Config Connector と Composite Resources
Kubernetes のカスタムリソース定義 (CRD) を用いて、複数の Google Cloud リソース (例: GKE クラスタ、Cloud SQL インスタンス、IAM ポリシー) を単一の「複合リソース」として定義・管理する機能です (OSS プロジェクト Crossplane に触発された考え方)。
アプリケーションとその依存インフラ (データベース、ロードバランサ等) を Kubernetes マニフェストで一体的に管理・オーケストレーションできます。これにより、インフラのプロビジョニングとアプリケーションデプロイの一貫性が向上し、IaC (Infrastructure as Code) を Kubernetes 中心で実現しやすくなります。将来的には、異なるクラウドプロバイダのリソース (ACK, ASO など) も含めた管理が視野に入ります。
AI/MLワークロード最適化
GKE Inference Gateway
AI モデル推論ワークロードに特化した高度な負荷分散機能です。
従来のラウンドロビンのような単純な方式ではなく、モデル固有のメトリクス (例: キーバリューキャッシュ使用率、保留キュー長) に基づいてトラフィックをインテリジェントにルーティングします。これにより、GPU/TPU の使用率を均一化し、推論の応答性を大幅に改善します。
こちらの機能は現在プレビューで公開されています。
Dynamic Workload Scheduler
GPU/TPU などのアクセラレータについて、より柔軟な利用とコスト最適化を可能にするスケジューリング機能です。
「将来の特定日時に保証されたキャパシティを予約する (割引価格の場合あり)」または「空き容量があるときに実行する (柔軟性を優先)」といった選択肢を提供します。これにより、特にバッチ処理的なトレーニングジョブや、重要度の低い実験的なジョブなどで、アクセラレータの在庫切れリスクを低減し、コストを最適化できます。
高速 GPU 起動
GPU ノードの起動プロセス (特にドライバのロードなど) を最適化し、起動時間を短縮します。
L4 GPU などで起動時間を最大 80% 削減できる見込みです。これにより、必要なアイドル容量を削減 (推定 20-30% 減) し、コスト効率とスケーリングの応答性を向上させます。
こちらの機能は現在プレビューで公開されています。
まとめ
GKE は 10 周年を迎え、単なるコンテナオーケストレーションツールから、AI/ML を含むあらゆる現代的なワークロードに対応する、スケーラブルで信頼性の高いプラットフォームへと進化を続けていることを強く感じました。
Next'25 で発表された新機能は、GKE が今後も Kubernetes エコシステムをリードしていくという強い意志を示すものと言えます。
Google Cloud Next '25 超速報セミナーのお知らせ
Next'25 へ現地参加ができなかったという方へ、弊社 PTE のシャンクスとラリオスが現地ラスベガスから日本の皆様へ超速報(ReCAP)を生配信でお届けいたします!
この機会にぜひご参加ください。
- 開催日:2025年4月11日(金) 11:00-12:00
- 会場: オンライン配信
- 定員:500名
- 参加費:無料
Discussion