跳至主要內容
ESC
跳到課程內容
解決方案架構設計 儲存與資料庫架構選型
0%
4 / 25 中級 30 分鐘 00:00

儲存與資料庫架構選型

全面解析 GCP 儲存與資料庫服務,從 Cloud SQL 到 AlloyDB、Spanner、BigQuery,建立資料層架構決策能力

2026年3月13日 Updated: 2026年3月20日

GCP 儲存服務概覽

資料層是所有雲端架構的基石。選錯儲存或資料庫服務,輕則效能低落、成本失控,重則架構重構。作為 PCA,你必須根據資料特性、存取模式和業務需求,精準選擇最適合的服務組合。

Cloud Storage(物件儲存)

Cloud Storage 是 GCP 最基礎的非結構化資料儲存服務,適用於圖片、影片、備份、日誌等場景。四種儲存類別對應不同的存取頻率和成本取捨:

類別最低存放期適用場景儲存成本
Standard高頻存取的活躍資料最高
Nearline30 天每月存取一次的備份較低
Coldline90 天每季存取一次的歸檔更低
Archive365 天極少存取的法規留存最低

Autoclass 是 v6.1 考試的重點功能——啟用後 Cloud Storage 會根據物件的實際存取頻率自動調整儲存類別,無需手動設定生命週期規則。對於存取模式不可預測的工作負載,Autoclass 能自動優化成本。

生命週期管理(Lifecycle Management) 則適用於存取模式明確的場景,你可以定義規則,例如:物件建立 30 天後移至 Nearline、90 天後移至 Coldline、365 天後刪除。

💡 考試小提示:題目出現「存取模式不確定」或「多種存取頻率混合」,優先選 Autoclass;出現「明確的保留政策」或「法規要求特定保留期限」,選 Lifecycle Policy。

Persistent Disk 與 Filestore

  • Persistent Disk — 區塊儲存,掛載到 Compute Engine 或 GKE 節點。分為 pd-standard(HDD)、pd-balanced(SSD)和 pd-ssd(高效能 SSD)三種等級
  • Hyperdisk — 新一代區塊儲存,提供更高的 IOPS 和吞吐量,且可獨立調整容量、IOPS 和吞吐量。包含 Hyperdisk Balanced(一般用途)、Hyperdisk Extreme(最高 IOPS,適合 SAP HANA、大型資料庫)、Hyperdisk ML(高吞吐量唯讀,適合 AI/ML 模型載入)和 Hyperdisk Throughput(大量循序 I/O)
  • Filestore — 全代管 NFS 檔案系統,適合需要共享檔案系統的傳統應用遷移(如 CMS、EDA 工作負載)

關聯式資料庫

Cloud SQL

Cloud SQL 是全代管的關聯式資料庫服務,支援 MySQL、PostgreSQL、SQL Server 三種引擎。它適合中小規模的 OLTP 工作負載,最大支援 128 vCPU、864 GB RAM,並提供自動備份、高可用(Regional HA)和讀取副本。

適用場景: 傳統 Web 應用、內容管理系統、中小型電商——大多數從地端遷移上雲的關聯式資料庫都應先評估 Cloud SQL。

AlloyDB

AlloyDB 是 v6.1 考試新增的重點服務,務必掌握。它是 Google 基於 PostgreSQL 打造的全代管資料庫,核心賣點:

  • 效能 — 交易處理速度比標準 PostgreSQL 快 4 倍,分析查詢快 100 倍
  • 完全相容 PostgreSQL — 現有 PostgreSQL 應用無需修改程式碼即可遷移
  • AI-Ready — 內建向量嵌入(Vector Embeddings)支援,可直接在資料庫層進行相似度搜尋,免去外部向量資料庫
  • 智慧儲存引擎 — 運算與儲存分離架構,支援自動快取和列式引擎加速分析

適用場景: 需要高效能 PostgreSQL 的企業應用、AI/ML 驅動的推薦系統、需要在同一資料庫同時處理交易和分析查詢的 HTAP 場景。

💡 考試小提示:題目提到「PostgreSQL 相容」且需要「高效能」或「向量搜尋 / AI 整合」,答案很可能是 AlloyDB。它是 v6.1 新增的明星服務,出題機率高。

Cloud Spanner

Cloud Spanner 是 Google 獨家的全球分散式關聯式資料庫,提供 99.999% SLA(每年停機不超過 5.26 分鐘)。核心特色:

  • 強一致性(Strong Consistency) — 即使跨大洲部署也能保證 ACID 交易
  • 水平擴展 — 像 NoSQL 一樣水平擴展,同時保持完整的關聯式語義
  • 全球部署 — 多區域配置支援全球低延遲讀寫

適用場景: 全球金融交易系統、跨國 ERP、需要強一致性且 Cloud SQL 單機效能不足的場景。

面向Cloud SQLAlloyDBSpanner
引擎MySQL / PG / SQL ServerPostgreSQL 相容Google 專屬
擴展性垂直擴展為主運算/儲存分離水平擴展
分散式單區域 HA單區域 HA全球多區域
SLA99.95%99.99%99.999%
AI 整合基本向量嵌入原生支援基本
成本最低中等最高
典型場景中小型 Web 應用高效能 PG + AI全球金融系統

NoSQL 資料庫

Firestore

Firestore 是全代管的文件型(Document) NoSQL 資料庫,以 JSON-like 文件和集合(Collection)組織資料。支援即時同步(Realtime Listeners)、離線存取、自動擴縮至零。

適用場景: 行動應用後端、使用者個人化設定、購物車、遊戲排行榜。

Bigtable

Bigtable 是全代管的寬列型(Wide-column) NoSQL 資料庫,專為大規模、低延遲的寫入密集工作負載設計。支援 PB 級資料量,讀寫延遲穩定在個位數毫秒。

適用場景: IoT 感測器時序資料、金融市場行情資料、廣告技術的使用者行為追蹤。

💡 考試小提示:看到「IoT」、「時序資料(time-series)」、「高吞吐量寫入」這些關鍵字,答案通常是 Bigtable;看到「文件型」、「行動應用」、「即時同步」,選 Firestore。

資料倉儲與分析

BigQuery

BigQuery 是 GCP 的無伺服器資料倉儲,同時也是 ML 平台(BigQuery ML)。核心能力:

  • 無伺服器分析 — 不需佈建叢集,按掃描量或 Slot 計費
  • PB 級查詢 — 列式儲存 + 分散式運算,TB 級查詢秒級完成
  • BigQuery ML — 直接用 SQL 建立、訓練、部署機器學習模型,無需資料搬移
  • 串流匯入 — 支援即時資料匯入,搭配 Pub/Sub + Dataflow 實現即時分析

適用場景: 企業數據倉儲、商業智慧報表、ML 模型訓練、日誌與事件分析。

Dataflow

Dataflow 是基於 Apache Beam 的全代管串流與批次處理引擎。它負責資料的 ETL(擷取、轉換、載入)流水線:

  • 統一模型 — 同一套程式碼同時支援串流(Stream)和批次(Batch)處理
  • 自動擴縮 — 根據資料量動態調整 Worker 數量
  • 常見管線 — Pub/Sub → Dataflow → BigQuery(即時分析);Cloud Storage → Dataflow → BigQuery(批次匯入)

資料庫選型決策框架

面對考試或實務中的選型題,你可以用以下決策矩陣快速判斷:

決策維度問自己的問題對應服務
資料結構結構化?半結構化?非結構化?結構化 → SQL 系列;半結構化 → Firestore;非結構化 → Cloud Storage
工作負載交易型(OLTP)?分析型(OLAP)?OLTP → Cloud SQL / AlloyDB / Spanner;OLAP → BigQuery
擴展需求單區域夠用?需要全球部署?區域 → Cloud SQL / AlloyDB;全球 → Spanner
規模量級GB?TB?PB?GB → Cloud SQL;TB → AlloyDB;PB → Spanner / BigQuery / Bigtable
計費模式固定成本可預測?按用量彈性?固定 → 預配容量;彈性 → BigQuery 隨用隨付 / Cloud Run
特殊需求向量搜尋?即時同步?時序資料?向量 → AlloyDB;即時 → Firestore;時序 → Bigtable

實戰情境

情境一:電商商品目錄系統

需求: 百萬級商品、複雜查詢(分類/篩選/全文搜尋)、讀取為主、加上 AI 推薦引擎

架構選型: AlloyDB 作為主要資料庫(PostgreSQL 相容 + 向量嵌入支援推薦引擎),搭配 Memorystore 快取熱門商品,商品圖片存放在 Cloud Storage(啟用 Autoclass)。

情境二:全球金融交易平台

需求: 跨 3 大洲即時交易、強一致性、99.999% 可用性、每秒萬筆交易

架構選型: Cloud Spanner(多區域配置保證全球強一致性),交易日誌串流至 BigQuery 進行風控分析,使用 Dataflow 進行即時異常偵測管線。

情境三:IoT 感測器資料平台

需求: 10 萬台設備每秒回傳資料、時序資料儲存 3 年、即時儀表板 + 歷史趨勢分析

架構選型: 設備資料透過 Pub/Sub 匯入,Dataflow 串流處理後寫入 Bigtable(即時查詢)和 BigQuery(歷史分析),原始資料歸檔至 Cloud Storage Coldline

💡 考試小提示:PCA 考試的儲存選型題通常不會只問你選哪一個服務,而是要你設計完整的資料架構——包含主資料庫、快取層、分析層和歸檔策略。練習時養成「全鏈路思考」的習慣。

重點整理

  • Cloud Storage 四種類別對應不同存取頻率,Autoclass 自動優化、Lifecycle Policy 手動控制
  • AlloyDB 是 v6.1 新增重點:PostgreSQL 相容、4 倍效能、原生向量嵌入
  • Cloud Spanner 唯一提供全球強一致性 + 水平擴展的關聯式資料庫,SLA 99.999%
  • BigQuery 身兼資料倉儲與 ML 平台,題目出現「分析」幾乎必選
  • Dataflow 統一串流與批次處理,是 GCP 資料管線的核心引擎
  • 選型決策從資料結構、工作負載、擴展需求、規模量級、計費模式五個維度切入

下一步

在下一課中,我們將學習如何從業務需求出發,運用 Architecture Framework 和 trade-off 分析做出最佳架構決策,掌握 PCA 案例題的核心思維。

徽章解鎖!