コンビニエンスストアのストアコンピュータ(ストコン)をオンプレミスからAWSへクラウド移行する案件における、DWH(データウェアハウス)領域のアーキテクチャ構成図です。
店舗のPOS端末からのリアルタイムデータと、ストアコンピュータからのバッチデータを統合し、S3データレイク → Redshift DWH → QuickSight BI の分析パイプラインを構成しています。
| レイヤー | AWSサービス | 用途 |
|---|---|---|
| データソース | Store Computer / POS Terminal | 店舗の売上・発注・在庫データ |
| 取り込み Batch | AWS DMS | ストコンDBからの一括移行 |
| 取り込み Realtime | Kinesis Data Streams + Firehose | POSトランザクションのリアルタイム取得 |
| データレイク | Amazon S3 (Raw / Processed / Curated) | 3層構造でデータ品質を段階的に向上 |
| ETL / ガバナンス | AWS Glue, Glue Data Catalog, Lake Formation | ETL処理、メタデータ管理、アクセス制御 |
| DWH | Amazon Redshift | 構造化データの集計・分析クエリ |
| アドホック分析 | Amazon Athena | S3上のデータに対するSQLクエリ |
| 可視化 | Amazon QuickSight | BIダッシュボード、定期レポート |
ap-northeast-1 (東京) リージョン基準の月額概算。実際の費用は利用量により変動します。為替レート: $1 = 150円
| サービス | 構成 | Dev (月額) | Prod (月額) |
|---|---|---|---|
| AWS DMS | レプリケーションインスタンス | $20-40 (3,000-6,000円) | $40-80 (6,000-12,000円) |
| Kinesis Data Streams | POS連携 (1-2 shard) | $15-30 (2,250-4,500円) | $30-75 (4,500-11,250円) |
| Kinesis Data Firehose | S3への配信 | $5-15 (750-2,250円) | $15-50 (2,250-7,500円) |
| S3 | データレイク (100-500GB) | $3-12 (450-1,800円) | $12-50 (1,800-7,500円) |
| AWS Glue ETL | データ変換ジョブ | $10-50 (1,500-7,500円) | $50-200 (7,500-30,000円) |
| Glue Data Catalog | メタデータ管理 | $1-3 (150-450円) | $3-5 (450-750円) |
| Lake Formation | アクセス制御 | $0 (無料) | $0 (無料) |
| Redshift Serverless | DWH (8-32 RPU) | $50-150 (7,500-22,500円) | $200-600 (30,000-90,000円) |
| Athena | アドホッククエリ | $5-20 (750-3,000円) | $20-50 (3,000-7,500円) |
| QuickSight | BI (Author 2名 + Reader 5名) | $73 (10,950円) | $73-150 (10,950-22,500円) |
| 合計 | $182-393 (約27,300-58,950円) | $443-1,260 (約66,450-189,000円) | |
前提条件: Dev=テストデータ100GB、Prod=店舗POS+ストコン連携500GB。Redshift Serverless RPU利用は業務時間帯中心。QuickSight Author $24/user/mo、Reader $5/user/mo。
コスト最適化: Redshift ServerlessのRPU使用量は自動スケールで夜間ゼロに。Glue ETLのジョブブックマークで差分処理。AthenaのパーティションスキャンでS3スキャン量を削減。
1. バッチとリアルタイムの二系統取り込み
ストコンDBからのバッチ移行(DMS)とPOSトランザクションのリアルタイム取得(Kinesis)を分離。それぞれのデータ特性(更新頻度・遅延許容度)に最適な取り込み方式を採用している。
2. S3データレイクの3層構造(Raw / Processed / Curated)
データ品質を段階的に向上させることで、生データの保全と分析用データの品質担保を両立。障害時にRaw層から再処理が可能。
3. Glue + Lake Formationによるガバナンス
ETL処理とメタデータ管理をGlueに集約し、Lake Formationで列レベルのアクセス制御を実現。コンプライアンス要件への対応が容易。
4. Athena と Redshift の使い分け
アドホック分析はサーバーレスのAthena、定期的な大量集計はRedshiftと役割を分離。コストと性能のバランスを最適化。
Powered by AWS Diagram MCP Server