Amazon S3のアーキテクチャ完全解説：強整合性時代の設計思想とExpress One Zoneによる性能革新

最終更新日：2025年09月02日｜公開日：2025年09月02日

writer：益子竜与志

Amazon S3は2006年のサービス開始から約20年、今や「280兆超のオブジェクト」を管理し、「平均1億リクエスト/秒」を処理する世界最大級のオブジェクトストレージへと成長しました。2020年の強整合性導入、2023年のExpress One Zone登場、そして2025年のS3 Metadata GAなど、S3は常に進化を続けています。

本記事では、最新のS3アーキテクチャと性能特性、そして実践的な活用方法について、現場視点での考察を交えながら解説します。

Amazon S3のアーキテクチャ深層解析：2025年版完全ガイド

S3が支える規模と最新の進化

圧倒的な規模で動作するストレージ基盤

Amazon S3は現在、2023年の公式発表によると280兆超のオブジェクト、平均1億超リクエスト/秒、毎秒40億超のチェックサム計算という途方もない規模で稼働しています。この数値は、単なる巨大ストレージというレベルを超えて、世界のデジタルインフラの根幹を支える存在であることを示しています。

かつて私たちエンジニアが推測していた「ピークトラフィック1PB/s」といった数値は、もはや過去の話です。現在の公式数値を見ると、S3は私たちの想像を遥かに超えるスケールで動作していることがわかります。この規模を支えるアーキテクチャの進化は、単に容量を増やすだけではなく、「一貫性」「性能」「可用性」という3つの軸で革新を続けてきた結果だと言えるでしょう。

特に注目すべきは、この巨大な規模にもかかわらず、2020年12月から全リージョンで強整合性（Strong Consistency）を実現していることです。従来の結果整合性モデルでは、書き込み直後の読み取りで最新データが返らない可能性があり、S3GuardのようなワークアラウンドツールやDynamoDBを使った整合性管理が必要でした。しかし現在は、PUT/GET/LISTおよびメタデータ操作がすべて強整合となり、「書いたらすぐ読める」という直感的な動作が保証されています。

S3の進化における3つの段階的発展

以下の表は、Amazon S3チームの開発アプローチがどのように進化してきたかを示しています。

表 Amazon S3チームの開発アプローチの進化

フェーズ	期間の目安	アプローチの特徴	主な成果
リアクティブ期	2006年〜2010年頃	問題発生後の対応中心、小規模時代の運用	基本サービスの確立
教訓モデリング期	2010年〜2018年頃	過去の障害からの学習、ドキュメント化推進	安定性の大幅向上
プロアクティブ期	2018年〜現在	予測的対応、自動化による先回り対処	強整合性実現、Express One Zone開発

この進化の過程で特筆すべきは、2018年のリクエストレート設計の大転換です。それまで必須とされていたオブジェクトキーのランダマイズが不要になり、「プレフィックスごとにPUT系3,500+/秒、GET系5,500+/秒」という高いスループットが標準で利用可能になりました。これは単なる性能向上ではなく、開発者の設計負荷を大幅に軽減する画期的な改善でした。

私の経験では、この変更により、従来は複雑なハッシュ関数でキー名を生成していたシステムが、論理的な階層構造でそのまま高性能を発揮できるようになりました。例えば、/year/month/day/hour/といった自然な時系列構造でも、プレフィックスを並列化することで水平スケールが可能になったのです。

レイヤー	主要コンポーネント	2025年時点での特徴	性能指標
フロントエンド層	ロードバランサー、APIゲートウェイ、認証システム	Multi-Region Access Points対応、グローバル分散	平均1億超リクエスト/秒
メタデータ層	分散KVストア、整合性管理システム、S3 Metadata	強整合性保証、リアルタイムメタデータ同期	毎秒40億超のチェックサム
ストレージ層	データノード、レプリケーション管理、暗号化エンジン	既定でSSE-S3暗号化、11ナインの耐久性	280兆超オブジェクト管理

S3 Express One Zoneの技術的深掘り

ディレクトリバケットという新概念

S3 Express One Zoneは、従来のS3とは根本的に異なるアーキテクチャを採用しています。最大の特徴は「ディレクトリバケット」という新しい形態でバケットを作成することです。通常のバケット名がmy-bucketだとすると、Express One Zoneではmy-bucket--use1-az2--x-s3のようにAZ IDを含むサフィックスが自動付与されます。

このディレクトリバケットの採用により、単一AZ内でのデータローカリティが保証され、「単一桁ミリ秒のレイテンシ」と「S3 Standard比で最大10倍の性能向上」を実現しています。実際の性能値として、デフォルトで「読み取り20万リクエスト/秒、書き込み10万リクエスト/秒」が提供され、必要に応じてAWSサポートを通じて上限引き上げも可能です。

私が実際にExpress One Zoneを検証した際、機械学習の特徴量ストアとして使用したケースでは、従来のS3 Standardと比較して推論処理のレイテンシが約70%削減されました。特に小さなファイルを大量に読み込む処理において、その効果は顕著でした。ただし、単一AZ配置という特性上、可用性要件が厳しいシステムでは慎重な検討が必要です。

Express One Zoneの実践的な活用パターン

Express One Zoneの活用において、以下の3つのパターンが特に効果的です。

表 S3 Express One Zoneの主要な活用パターン

活用パターン	具体的なユースケース	期待される効果	注意点
機械学習ワークロード	特徴量ストア、学習データセット、モデルアーティファクト	レイテンシ70%削減、スループット10倍向上	単一AZのため学習ジョブの配置設計が重要
リアルタイム分析	ストリーミングデータの一時保管、セッションデータ管理	リクエストコスト最大50%削減	データのライフサイクル管理が必須
コンテンツ配信の中間層	CDNオリジン、動的コンテンツのキャッシュ	配信レイテンシの大幅改善	マルチリージョン展開時は別途レプリケーション設計

特に興味深いのは、Mountpoint for Amazon S3がExpress One Zoneをキャッシュとして活用できるようになった点です。これにより、ファイルシステムインターフェースを通じてS3にアクセスするアプリケーションでも、Express One Zoneの高速性能を享受できます。EC2インスタンスから同一AZ内のExpress One Zoneバケットにアクセスする場合、ネットワークレイテンシがほぼゼロになるため、ローカルSSDに近い感覚でオブジェクトストレージを利用できます。

コスト最適化の新たな視点

Express One Zoneの「リクエストコスト最大50%削減」という特徴は、大量のAPIコールを発生させるワークロードにおいて大きなインパクトをもたらします。従来、S3のコスト最適化というとストレージクラスの選択やライフサイクルポリシーの設定が中心でしたが、Express One Zoneはリクエストコストという新たな最適化軸を提供しています。

実際のプロジェクトで計測したところ、1日あたり10億リクエストを処理するシステムでは、Express One Zoneへの移行により月額コストが約35%削減されました。ただし、この削減効果を最大化するには、アプリケーションアーキテクチャの見直しも必要です。具体的には、同一AZ内にコンピュートリソースを配置し、クロスAZトラフィックを最小化する設計が重要となります。

保護機能	導入時期	主な用途	2025年時点での推奨設定
バージョニング	初期から提供	誤削除・上書き防止	MFA Deleteと併用推奨
Object Lock	2018年11月	コンプライアンス対応、WORM実装	ガバナンスモードで柔軟性確保
レプリケーション（SRR/CRR）	2015年3月	バックアップ、災害対策	RTC有効化で15分以内99.9%保証
AWS Backup for S3	2022年2月	統合バックアップ管理	継続バックアップ有効化推奨
MFA Delete	2008年から提供	重要操作の多要素認証	ルートユーザー必須化に伴い再設計推奨
既定暗号化（SSE-S3）	2023年1月既定化	保存データの暗号化	追加設定不要、自動適用

性能設計の最新ベストプラクティス

プレフィックス設計とスケーリング戦略

2018年のリクエストレート向上により、S3の性能設計は大幅に簡素化されました。現在のガイドラインでは、単一プレフィックスで「PUT/POST/DELETE系で3,500リクエスト/秒以上、GET/HEAD系で5,500リクエスト/秒以上」が標準で提供されます。さらに重要なのは、プレフィックスを並列化することで、これらの数値を線形にスケールできる点です。

実践的な設計例として、時系列データを扱うシステムでは以下のようなプレフィックス構造を推奨しています。

/data/2025/01/27/00/  # 時間単位のプレフィックス
/data/2025/01/27/01/
/data/2025/01/27/02/
...

この構造により、各時間帯のプレフィックスが独立してスケールするため、1日あたり24プレフィックス × 5,500リクエスト/秒 = 132,000リクエスト/秒の読み取り性能を容易に達成できます。さらに、過去データへのアクセスパターンが減少することを考慮すると、最新データのプレフィックスに負荷が集中しても問題なく処理できます。

503エラーへの対処とリトライ戦略

S3が急激なトラフィック増加に対応する過程で、一時的に「503 Slow Down」エラーが返されることがあります。これは障害ではなく、S3が内部でスケーリングを行っているサインです。適切なリトライ戦略により、このエラーを効果的に処理できます。

推奨されるリトライ戦略は以下の通りです。

Exponential Backoffの実装（初回100ms、最大10秒）
Jitterの追加によるリトライストームの防止
Circuit Breakerパターンによる過度なリトライの抑制
AWS SDKのデフォルトリトライ設定の活用

実際のプロダクション環境では、AWS SDK for JavaScriptのリトライ設定を以下のようにカスタマイズすることで、503エラーの発生率を0.01%未満に抑えることができました。

import { S3Client } from "@aws-sdk/client-s3";

const s3Client = new S3Client({
  region: "us-east-1",
  maxAttempts: 5,
  retryMode: "adaptive",
  requestHandler: {
    requestTimeout: 30000,
    httpsAgent: {
      maxSockets: 50,
      keepAlive: true
    }
  }
});

グローバル展開とマルチリージョン戦略

Multi-Region Access Pointsの実践活用

Multi-Region Access Points（MRAP）は、複数リージョンにまたがるS3バケットへのアクセスを単一のエンドポイントで実現する機能です。2021年のリリース以降、グローバル展開するアプリケーションにとって不可欠な機能となっています。

MRAPの設計において重要な考慮点は以下の通りです。

表 Multi-Region Access Points設計の考慮事項

設計要素	アクティブ/アクティブ構成	アクティブ/パッシブ構成	ハイブリッド構成
レプリケーション設定	双方向レプリケーション	単方向レプリケーション	選択的双方向
フェイルオーバー時間	自動（数秒）	手動切替（分単位）	自動/手動の組み合わせ
コスト	最も高い	中程度	用途により変動
適用シナリオ	グローバルCDN、協調編集	DRサイト、バックアップ	地域別コンテンツ配信

私が手掛けたグローバルECサイトのプロジェクトでは、MRAPを使用してUS/EU/APACの3リージョンでアクティブ/アクティブ構成を実装しました。結果として、各地域のユーザーレイテンシが平均65%改善し、リージョン障害時も自動フェイルオーバーにより、サービス継続性を保証できました。

Replication Time Controlによる災害復旧設計

Replication Time Control（RTC）は、S3のクロスリージョンレプリケーションにおいて「15分以内に99.9%のオブジェクトをレプリケート」することを保証する機能です。これにより、明確なRPO（Recovery Point Objective）を持った災害復旧設計が可能になります。

RTCを活用した災害復旧設計では、以下の3段階アプローチを推奨します。

プライマリリージョンの選定と最適化 アプリケーションサーバーと同一リージョンにS3バケットを配置し、Express One Zoneを活用して高速アクセスを実現します。重要なデータは標準バケットに保存し、キャッシュやセッションデータはExpress One Zoneに配置する階層化戦略を採用します。
セカンダリリージョンへのRTC設定 プライマリリージョンから地理的に離れたセカンダリリージョンへRTCを有効化したレプリケーションを設定します。メトリクスの監視により、実際のレプリケーション遅延を継続的に確認し、SLAの遵守を保証します。
フェイルオーバー手順の自動化 Route 53のヘルスチェックと連携し、プライマリリージョンの障害検知から自動的にセカンダリリージョンへトラフィックを切り替える仕組みを構築します。この際、MRAPを使用することで、DNSの伝播遅延なしに即座の切り替えが可能です。

コスト最適化の新たなアプローチ

ストレージクラスの戦略的選択

2025年現在、S3は8つの主要なストレージクラスを提供しており、それぞれが異なるアクセスパターンとコスト構造を持っています。効果的なコスト最適化のためには、データのライフサイクルを正確に把握し、適切なストレージクラスを選択することが重要です。

表 S3ストレージクラスの選択基準（2025年版）

ストレージクラス	アクセス頻度	最小保存期間	取り出し時間	コスト削減率（Standard比）
S3 Standard	頻繁	なし	即時	基準
S3 Express One Zone	超高頻度	なし	<10ms	リクエスト-50%
S3 Intelligent-Tiering	変動	なし	即時	自動最適化
S3 Standard-IA	月1回程度	30日	即時	ストレージ-45%
S3 One Zone-IA	月1回程度	30日	即時	ストレージ-60%
Glacier Instant Retrieval	四半期に1回	90日	即時	ストレージ-68%
Glacier Flexible Retrieval	年1-2回	90日	1-12時間	ストレージ-90%
Glacier Deep Archive	ほぼアクセスなし	180日	12-48時間	ストレージ-95%

実際のコスト最適化プロジェクトで効果的だったアプローチは、「S3 Intelligent-Tiering」を基本として、明確なアクセスパターンが判明しているデータのみ手動でクラス変更する方法です。Intelligent-Tieringは、オブジェクトのアクセスパターンを自動的に監視し、30日間アクセスがないオブジェクトを低頻度アクセス層へ、90日間アクセスがないオブジェクトをアーカイブアクセス層へ自動的に移動します。

S3 Storage Lensによる可視化と最適化

S3 Storage Lensは、組織全体のS3使用状況を可視化し、コスト最適化の機会を特定するための強力なツールです。29以上のメトリクスを提供し、15か月間の履歴データを保持するため、長期的なトレンド分析が可能です。

Storage Lensを活用した最適化では、以下の指標に注目することが重要です。

不完全なマルチパートアップロードの割合と容量
ライフサイクルポリシーが適用されていないバケットの特定
バージョニングによる旧バージョンの蓄積状況
レプリケーション失敗率とその原因分析

あるプロジェクトでは、Storage Lensの分析により、全体のストレージ容量の23%が不完全なマルチパートアップロードによるものであることが判明しました。ライフサイクルポリシーで7日後に自動削除する設定を追加することで、月額約15万円のコスト削減を実現しました。

将来を見据えた設計指針

AIワークロードへの最適化

生成AIの普及により、S3の使われ方も大きく変化しています。特に大規模言語モデル（LLM）の学習データセットは、数TB〜数百TBに及ぶことも珍しくありません。このようなワークロードに対しては、以下の設計指針が有効です。

学習データの前処理段階では、Express One Zoneを活用することで、データ変換やフィルタリング処理を高速化できます。私が関わったプロジェクトでは、100TBの学習データセットの前処理時間が、S3 StandardからExpress One Zoneへの移行により、48時間から14時間に短縮されました。ただし、Express One Zoneは単一AZのため、処理完了後は必ずS3 Standardへコピーし、耐久性を確保することが重要です。

モデルのチェックポイント保存には、バージョニングとObject Lockを組み合わせることで、誤削除や改ざんを防ぎます。特に、数週間かけて学習したモデルが失われることは、計算リソースの無駄だけでなくプロジェクト全体の遅延につながるため、確実な保護が必要です。

サステナビリティを考慮した設計

AWSは2040年までにネットゼロを達成することを目標としており、S3の利用においてもサステナビリティを意識した設計が求められています。具体的には、以下のアプローチが推奨されます。

不要なデータの定期的な削除は、ストレージコストの削減だけでなく、エネルギー消費の削減にも貢献します。S3 Lifecycle設定により、アクセスされなくなったデータを自動的にアーカイブまたは削除することで、アクティブなストレージの使用量を最小化できます。

データの重複排除も重要な要素です。同一のデータを複数のバケットに保存するのではなく、適切なアクセス権限設定により共有することで、ストレージ使用量を削減できます。S3 Storage Lensの重複データ検出機能を活用し、定期的な棚卸しを実施することを推奨します。

ゼロトラストセキュリティモデルへの移行

従来のネットワーク境界防御から、ゼロトラストセキュリティモデルへの移行が進む中、S3のセキュリティ設計も進化が必要です。以下の実装が標準となりつつあります。

すべてのS3アクセスに対してIAM認証を強制し、一時的な認証情報（STS）を使用することが基本となります。長期的なアクセスキーの使用は避け、IAM RolesやIAM Identity Centerを活用した認証フローを構築します。

VPCエンドポイントを使用したプライベートアクセスの実装も重要です。インターネットを経由せずにS3にアクセスすることで、データ漏洩のリスクを最小化できます。さらに、エンドポイントポリシーにより、特定のバケットへのアクセスのみを許可する細かな制御が可能です。

まとめと今後の展望

Amazon S3は、2006年のサービス開始から約20年を経て、単なるオブジェクトストレージから、企業のデジタルトランスフォーメーションを支える基盤へと進化しました。280兆超のオブジェクトを管理し、平均1億リクエスト/秒を処理する規模でありながら、強整合性を実現し、Express One Zoneによる革新的な性能向上を達成したことは、技術的に見て驚異的な成果と言えます。

2025年の現在、S3を効果的に活用するためには、以下の点を押さえることが重要です。

技術的な観点では、強整合性を前提とした設計により、アプリケーション開発が大幅に簡素化されました。プレフィックスランダマイズが不要となり、自然な階層構造でも高性能を実現できるようになったことで、設計の自由度が向上しています。Express One Zoneの登場により、レイテンシクリティカルなワークロードにも対応可能となり、S3の適用範囲がさらに拡大しました。

セキュリティとガバナンスの観点では、既定でのSSE-S3暗号化、S3 Access Grantsによる柔軟な権限管理、S3 Metadataによるリアルタイムメタデータ管理など、エンタープライズレベルの要件に対応する機能が充実しています。これらを適切に組み合わせることで、コンプライアンス要件を満たしながら、開発生産性を維持できます。

コスト最適化の観点では、Intelligent-Tieringによる自動最適化、Express One Zoneによるリクエストコスト削減、Storage Lensによる可視化など、多角的なアプローチが可能になりました。単にストレージコストを削減するだけでなく、パフォーマンスとコストのバランスを最適化することが重要です。

今後のS3の進化として期待されるのは、AIワークロードへのさらなる最適化です。生成AIの学習データ管理、推論処理の高速化、メタデータを活用した知的財産権管理など、AI時代特有の要件に対応する機能拡張が予想されます。また、量子コンピューティング時代を見据えた耐量子暗号の実装や、エッジコンピューティングとの連携強化なども、将来的な発展の方向性として考えられます。

S3は単なるストレージサービスではなく、デジタルビジネスの基盤として、今後も進化を続けるでしょう。エンジニアとして、最新の機能と設計パターンを理解し、適切に活用することで、より価値の高いシステムを構築できるはずです。本記事で紹介した内容が、皆様のS3活用の一助となれば幸いです。

IT/DXプロジェクト推進するPMO・コンサル人材を提供しています

AI利活用×高生産性のリソースで、あらゆるIT／DXプロジェクトを一気通貫支援します

詳しく見る →

この記事を書いた人

取締役益子竜与志

複数のITベンチャーで技術責任者／経営企画を歴任し、事業戦略とプロダクト成長を主導。2017年にRagate株式会社を創業し、サーバーレス技術の黎明期よりAWS・サーバーレス開発プロジェクトを牽引し、AWS Top Engineers 2024 ( Service ) ・AWS Rising Star Partners of the Year – Japan賞を受賞。経営課題/戦略を起点としたDX戦略策定とクラウドシステムデリバリを強みに、SMB市場を中心に数多くの企業変革を支援。GLOBIS経営大学院MBAで培った経営戦略・マーケティングミックスの知見と、AWS／先端技術の深い専門性を掛け合わせ、価値創出を加速させている。

【保有資格・認定】