re:Invent 2025 注目サーバーレス機能の実践活用ガイド — 本番アーキテクトが押さえるべき導入判断と設計パターン

益子 竜与志
益子 竜与志
XThreads
最終更新日:2026年06月04日公開日:2026年06月04日

re:Invent 2025で発表されたAWSサーバーレス新機能を「どう使うか」という実践視点で深掘りします。Lambda durable functions・Managed Instances・API Gatewayレスポンスストリーミング・ECS Express Modeそれぞれの使いどころと設計上の判断基準を整理し、本番運用中のアーキテクトが即日の意思決定に使えるフローチャートも提供します。

re:Invent 2025では、サーバーレスアーキテクチャに関わるエンジニアにとって見逃せない機能が複数リリースされました。本記事では「何が出たか」という紹介ではなく、「本番環境でどう使うか」「既存設計のどこに組み込むか」という実践的な視点で各機能を深掘りします。サーバーレスを本番運用しているアーキテクトやTechリードに向けて、即日の意思決定に役立てていただける内容を目指しました。

Lambda durable functions が解決する「状態管理の地獄」

マルチステップのワークフローをLambdaで実装しようとすると、必ずといっていいほど「状態管理をどこに持つか」「途中でエラーが出たときどうリトライするか」という問題に突き当たります。DynamoDBに中間状態を書いてポーリングする、Step Functionsに書き直す——いずれも相当な実装コストがかかっていました。

Lambda durable functionsはこの問題を根本から解決します。既存のLambda関数に「durable execution」を有効化するだけで、状態管理・リトライ・一時停止が自動化されます。核心となる概念はチェックポイント&リプレイです。context.step()で囲んだ処理がチェックポイントとして保存され、障害発生時には最後の成功チェックポイントから自動再開します。context.wait()を使うと、コンピュート課金なしで最大1年間の一時停止が可能です。

// TypeScript: withDurableExecutionでhandlerをラップするだけ
export const handler = withDurableExecution(async (event, context) => {
  const order = await context.step(() => validateOrder(event.orderId));
  // 外部承認待ち(課金なしで停止、最大数日)
  const approval = await context.wait({ name: 'approval', type: 'callback' });
  await context.step(() => processOrder(order, approval));
});

durable functionsを選ぶべきケースは、既存Lambda関数へのステート管理後付け・AIエージェントのオーケストレーション・Human-in-the-loopが必要な承認フロー・Sagaパターンによる分散トランザクションです。一方、ビジュアルなワークフロー設計が必要な場合や、既存のStep Functionsが安定稼働している場合は移行の必要はありません。

現時点でGA提供はUS East (Ohio) のみで、Python 3.13/3.14 および Node.js 22/24 ランタイムが対象です。本番採用前にリージョン展開スケジュールを確認してください。

Lambda durable functionsのチェックポイント&リプレイの仕組みを示すインフォグラフィック

API Gatewayレスポンスストリーミングの実装パターン

2025年11月19日、REST APIでのレスポンスストリーミングがGAになりました。LLMを活用したアプリケーションを構築しているチームにとって、アーキテクチャを根本から見直す価値がある機能です。

従来のAPI Gateway REST APIはレスポンス全体をバッファリングしてからクライアントに返していました。LLMのようにレスポンス生成に数秒かかるAPIでは、ユーザーは応答完了まで待ち続けることになります。ストリーミング対応により、最初のトークンが生成された瞬間からクライアントに届き始め、TTFB(Time to First Byte)が劇的に改善されます。

Lambda関数にストリーミング対応を組み込むには、awslambda.streamifyResponseでハンドラーをラップします。API Gateway側では、インテグレーションのresponseTransferModeSTREAMに設定し、Lambda呼び出しURIに/response-streaming-invocationsを含めます。

// Node.js: streamifyResponseでラップし、Bedrockストリームを転送
export const handler = awslambda.streamifyResponse(
  async (event, responseStream) => {
    responseStream = awslambda.HttpResponseStream.from(responseStream, {
      statusCode: 200, headers: { 'Content-Type': 'text/event-stream' }
    });
    const bedrockStream = await bedrock.invokeModelWithResponseStream(params);
    for await (const chunk of bedrockStream.body) responseStream.write(chunk);
    responseStream.end();
  }
);

設計上の注意点として、タイムアウトは最大15分(従来29秒から解消)、最初の10MBは帯域無制限ですが超過分は2MB/sに制限されます。VPC環境ではLambda Function URLはストリーミング非対応で、InvokeWithResponseStream APIを経由する必要があります。

Lambda Managed Instances と ECS Express Mode が変えるサーバーレスの境界線

「サーバーレス vs コンテナ」という二項対立が崩れつつあります。re:Invent 2025では、その境界線を曖昧にする2つの機能が登場しました。

Lambda Managed Instancesは、Graviton4やネットワーク最適化インスタンスなど特殊なEC2インスタンスタイプを、Lambdaのプログラミングモデルで使えるようにします。OSパッチ・ロードバランシング・オートスケーリングはAWSが管理します。料金はリクエスト課金($0.20/百万)+EC2インスタンス料金+管理費(EC2 on-demand価格の15%プレミアム)という構造で、Compute Savings PlansやReserved Instancesがそのまま使えます。m7g.xlargeで3年Compute Savings Planを適用するとEC2部分を最大72%削減でき、高スループット常時稼働ワークロードでは大きな効果があります。

ECS Express Modeは、コンテナイメージ・タスク実行ロール・インフラロールの3点だけで本番級のコンテナ環境を即座に立ち上げる機能です(2025年11月21日 GA)。ALB・TLS証明書・オートスケーリング・カナリアデプロイ・CloudWatchログ・最小権限セキュリティグループがすべて自動プロビジョニングされます。

判断基準

Lambda

ECS Express Mode

実行時間

最大15分

無制限

起動特性

コールドスタートあり

常時起動

料金モデル

実行時間課金

インスタンス時間課金

最適な用途

イベント駆動・短期処理

常時稼働Web API・長時間処理

Database Savings Plans とコスト最適化の新常識

2025年12月2日にリリースされたDatabase Savings Plansは、AWSマネージドデータベースサービスを横断する柔軟な割引プランです。最大35%の割引が得られ、1年コミットメント・前払い不要で利用できます。Aurora・RDS・DynamoDB・ElastiCache・DocumentDB・Neptune等が対象です。

  • サーバーレス構成(Aurora Serverless等) — 最大35%削減
  • プロビジョニング済みインスタンス — 最大20%削減
  • DynamoDB on-demand — 最大18%削減

従来のRDS Reserved Instancesはエンジンやインスタンスタイプをコミットする必要がありましたが、Database Savings Plansはエンジン・インスタンスファミリー・リージョンをまたいでフレキシブルに適用されます。RDS for OracleからAurora PostgreSQLへのマイグレーション途中でも割引が継続して適用される点は、モダナイゼーションを進めるチームに大きなメリットです。

実務での導入判断フローチャート — 5つの観点で選択肢を絞り込む

ここまで紹介してきた機能を「どれを使うか」の判断に落とし込みます。

観点1 — 実行時間と処理モデル
イベント駆動・15分以内なら従来のLambda継続。常時稼働・長時間処理ならECS Express Mode。特殊インスタンス(GPU/高メモリ)が必要でLambdaプログラミングモデルを維持したいならLambda Managed Instances。

観点2 — ステート管理の必要性
ステートレスならそのままLambda。マルチステップでコードファーストならLambda durable functions。ビジュアル設計が必要またはStep Functionsが既に安定稼働しているなら移行不要。

観点3 — レスポンス特性
LLM/AIのストリーミング応答をRESTで提供するならAPI Gatewayレスポンスストリーミング。10MB超のペイロードを返す場合も有効。

観点4 — コスト最適化の余地
DB使用中で安定した使用量があるならDatabase Savings Plans検討は必須。高スループット常時稼働ならLambda Managed Instances + EC2 Reserved Instances。

観点5 — 移行コストとリスク
durable functionsはラッパー追加のみで最小変更。ECS Express Modeは既存Dockerコンテナの最速移行ルート。既存Step Functionsは移行不要。

サーバーレス技術の導入判断フローチャート

re:Invent 2025のサーバーレス関連アップデートは、「これまで大変だったことがシンプルになる」機能が中心です。既存アーキテクチャを大幅に見直す必要はなく、ピンポイントで差し替えを検討できるものばかりです。本記事で整理した5つの判断フローを参考に、自チームのワークロードに当てはめて優先順位をつけてみてください。

AI-NATIVE WORKSPACE

Openclaw AX

いつもの業務がAIとの共同作業に変わる革新的AI製品

詳しく見る →
Openclaw AX

IT/DXプロジェクト推進するPMO・コンサル人材を提供しています

AI利活用×高生産性のリソースで、あらゆるIT/DXプロジェクトを一気通貫支援します

詳しく見る →
AI駆動型ITコンサルティング
Careerバナーconsultingバナー