← 一覧に戻る

Modern Data Lakehouse on AWS(draw.io編集版)

技術ドメイン収集 C4モデル

作成日: 2026-03-29 / 作成者: SAS-Sasao

flowchart LR
    subgraph sources["データソース"]
        DB["On-Prem DB"]
        STREAM["Streaming Events"]
        FILE["File Upload"]
    end
    subgraph aws["AWS Cloud"]
        subgraph ingest["取り込み"]
            DMS["AWS DMS CDC"]
            KDS["Kinesis Data Streams"]
            KDF["Kinesis Firehose"]
            SFN["Step Functions"]
        end
        subgraph medallion["Medallion Architecture"]
            S3B["S3 Bronze Raw"]
            GLUE["Glue ETL"]
            S3S["S3 Silver Cleaned"]
            EMR["EMR Spark"]
            S3G["S3 Gold Aggregated"]
        end
        subgraph analytics["分析"]
            ATHENA["Amazon Athena"]
            RS["Redshift Serverless"]
        end
        QS["Amazon QuickSight"]
        subgraph governance["ガバナンス"]
            CATALOG["Glue Data Catalog"]
            LF["Lake Formation"]
        end
    end
    DB --> DMS --> S3B
    STREAM --> KDS --> KDF --> S3B
    FILE --> SFN --> S3B
    S3B --> GLUE --> S3S --> EMR --> S3G
    S3G --> ATHENA --> QS
    S3G --> RS --> QS
    GLUE -.-> CATALOG
    EMR -.-> CATALOG
    CATALOG -.-> LF
    LF -.-> ATHENA
    LF -.-> RS
    
draw.io XML をダウンロード
AWS公式アイコン対応: .drawioファイルにはAWS Architecture Icons(mxgraph.aws4)を使用しています。 draw.ioデスクトップアプリまたはWeb版で開くとAWS公式アイコンが表示されます。
AWS Diagram MCP版(PNG画像+IaCコード)を見る

概要

Medallionアーキテクチャ(Bronze/Silver/Gold)による段階的なデータ品質向上を実現する モダンデータレイクハウスの参照構成図。バッチ(DMS)、ストリーミング(Kinesis)、 ファイルアップロード(Step Functions)の3つの取り込みパターンに対応し、 Glue ETL / EMR Sparkによる処理パイプラインを経て、Athena / Redshift Serverlessで分析。

構成要素

レイヤーAWSサービス用途
データソースOn-Prem DB / Streaming / File3種類の取り込みパターン
取り込み(Batch)AWS DMSCDC差分レプリケーション
取り込み(Realtime)Kinesis Data Streams + Firehoseストリーミング取得・S3配信
取り込み(File)Step Functionsファイルアップロードオーケストレーション
BronzeAmazon S3生データ保持(スキーマオンリード)
ETL処理AWS Glue ETLBronze→Silverのクレンジング
SilverAmazon S3クレンジング・型変換・重複排除済み
Spark処理Amazon EMRSilver→Goldの集計・結合
GoldAmazon S3ビジネスロジック適用済み(分析最適化)
カタログGlue Data Catalogスキーマ・パーティション管理
ガバナンスLake Formation列/行レベルのアクセス制御
アドホック分析Amazon AthenaサーバーレスSQLクエリ
DWH分析Redshift Serverless高性能DWHクエリ・定期レポート
可視化Amazon QuickSightBIダッシュボード

設計のポイント

Generated by /company-drawio — draw.io MCP Server (AWS Architecture Icons)