GCP 儲存服務概覽
資料層是所有雲端架構的基石。選錯儲存或資料庫服務,輕則效能低落、成本失控,重則架構重構。作為 PCA,你必須根據資料特性、存取模式和業務需求,精準選擇最適合的服務組合。
Cloud Storage(物件儲存)
Cloud Storage 是 GCP 最基礎的非結構化資料儲存服務,適用於圖片、影片、備份、日誌等場景。四種儲存類別對應不同的存取頻率和成本取捨:
| 類別 | 最低存放期 | 適用場景 | 儲存成本 |
|---|---|---|---|
| Standard | 無 | 高頻存取的活躍資料 | 最高 |
| Nearline | 30 天 | 每月存取一次的備份 | 較低 |
| Coldline | 90 天 | 每季存取一次的歸檔 | 更低 |
| Archive | 365 天 | 極少存取的法規留存 | 最低 |
Autoclass 是 v6.1 考試的重點功能——啟用後 Cloud Storage 會根據物件的實際存取頻率自動調整儲存類別,無需手動設定生命週期規則。對於存取模式不可預測的工作負載,Autoclass 能自動優化成本。
生命週期管理(Lifecycle Management) 則適用於存取模式明確的場景,你可以定義規則,例如:物件建立 30 天後移至 Nearline、90 天後移至 Coldline、365 天後刪除。
💡 考試小提示:題目出現「存取模式不確定」或「多種存取頻率混合」,優先選 Autoclass;出現「明確的保留政策」或「法規要求特定保留期限」,選 Lifecycle Policy。
Persistent Disk 與 Filestore
- Persistent Disk — 區塊儲存,掛載到 Compute Engine 或 GKE 節點。分為 pd-standard(HDD)、pd-balanced(SSD)和 pd-ssd(高效能 SSD)三種等級
- Hyperdisk — 新一代區塊儲存,提供更高的 IOPS 和吞吐量,且可獨立調整容量、IOPS 和吞吐量。包含 Hyperdisk Balanced(一般用途)、Hyperdisk Extreme(最高 IOPS,適合 SAP HANA、大型資料庫)、Hyperdisk ML(高吞吐量唯讀,適合 AI/ML 模型載入)和 Hyperdisk Throughput(大量循序 I/O)
- Filestore — 全代管 NFS 檔案系統,適合需要共享檔案系統的傳統應用遷移(如 CMS、EDA 工作負載)
關聯式資料庫
Cloud SQL
Cloud SQL 是全代管的關聯式資料庫服務,支援 MySQL、PostgreSQL、SQL Server 三種引擎。它適合中小規模的 OLTP 工作負載,最大支援 128 vCPU、864 GB RAM,並提供自動備份、高可用(Regional HA)和讀取副本。
適用場景: 傳統 Web 應用、內容管理系統、中小型電商——大多數從地端遷移上雲的關聯式資料庫都應先評估 Cloud SQL。
AlloyDB
AlloyDB 是 v6.1 考試新增的重點服務,務必掌握。它是 Google 基於 PostgreSQL 打造的全代管資料庫,核心賣點:
- 效能 — 交易處理速度比標準 PostgreSQL 快 4 倍,分析查詢快 100 倍
- 完全相容 PostgreSQL — 現有 PostgreSQL 應用無需修改程式碼即可遷移
- AI-Ready — 內建向量嵌入(Vector Embeddings)支援,可直接在資料庫層進行相似度搜尋,免去外部向量資料庫
- 智慧儲存引擎 — 運算與儲存分離架構,支援自動快取和列式引擎加速分析
適用場景: 需要高效能 PostgreSQL 的企業應用、AI/ML 驅動的推薦系統、需要在同一資料庫同時處理交易和分析查詢的 HTAP 場景。
💡 考試小提示:題目提到「PostgreSQL 相容」且需要「高效能」或「向量搜尋 / AI 整合」,答案很可能是 AlloyDB。它是 v6.1 新增的明星服務,出題機率高。
Cloud Spanner
Cloud Spanner 是 Google 獨家的全球分散式關聯式資料庫,提供 99.999% SLA(每年停機不超過 5.26 分鐘)。核心特色:
- 強一致性(Strong Consistency) — 即使跨大洲部署也能保證 ACID 交易
- 水平擴展 — 像 NoSQL 一樣水平擴展,同時保持完整的關聯式語義
- 全球部署 — 多區域配置支援全球低延遲讀寫
適用場景: 全球金融交易系統、跨國 ERP、需要強一致性且 Cloud SQL 單機效能不足的場景。
| 面向 | Cloud SQL | AlloyDB | Spanner |
|---|---|---|---|
| 引擎 | MySQL / PG / SQL Server | PostgreSQL 相容 | Google 專屬 |
| 擴展性 | 垂直擴展為主 | 運算/儲存分離 | 水平擴展 |
| 分散式 | 單區域 HA | 單區域 HA | 全球多區域 |
| SLA | 99.95% | 99.99% | 99.999% |
| AI 整合 | 基本 | 向量嵌入原生支援 | 基本 |
| 成本 | 最低 | 中等 | 最高 |
| 典型場景 | 中小型 Web 應用 | 高效能 PG + AI | 全球金融系統 |
NoSQL 資料庫
Firestore
Firestore 是全代管的文件型(Document) NoSQL 資料庫,以 JSON-like 文件和集合(Collection)組織資料。支援即時同步(Realtime Listeners)、離線存取、自動擴縮至零。
適用場景: 行動應用後端、使用者個人化設定、購物車、遊戲排行榜。
Bigtable
Bigtable 是全代管的寬列型(Wide-column) NoSQL 資料庫,專為大規模、低延遲的寫入密集工作負載設計。支援 PB 級資料量,讀寫延遲穩定在個位數毫秒。
適用場景: IoT 感測器時序資料、金融市場行情資料、廣告技術的使用者行為追蹤。
💡 考試小提示:看到「IoT」、「時序資料(time-series)」、「高吞吐量寫入」這些關鍵字,答案通常是 Bigtable;看到「文件型」、「行動應用」、「即時同步」,選 Firestore。
資料倉儲與分析
BigQuery
BigQuery 是 GCP 的無伺服器資料倉儲,同時也是 ML 平台(BigQuery ML)。核心能力:
- 無伺服器分析 — 不需佈建叢集,按掃描量或 Slot 計費
- PB 級查詢 — 列式儲存 + 分散式運算,TB 級查詢秒級完成
- BigQuery ML — 直接用 SQL 建立、訓練、部署機器學習模型,無需資料搬移
- 串流匯入 — 支援即時資料匯入,搭配 Pub/Sub + Dataflow 實現即時分析
適用場景: 企業數據倉儲、商業智慧報表、ML 模型訓練、日誌與事件分析。
Dataflow
Dataflow 是基於 Apache Beam 的全代管串流與批次處理引擎。它負責資料的 ETL(擷取、轉換、載入)流水線:
- 統一模型 — 同一套程式碼同時支援串流(Stream)和批次(Batch)處理
- 自動擴縮 — 根據資料量動態調整 Worker 數量
- 常見管線 — Pub/Sub → Dataflow → BigQuery(即時分析);Cloud Storage → Dataflow → BigQuery(批次匯入)
資料庫選型決策框架
面對考試或實務中的選型題,你可以用以下決策矩陣快速判斷:
| 決策維度 | 問自己的問題 | 對應服務 |
|---|---|---|
| 資料結構 | 結構化?半結構化?非結構化? | 結構化 → SQL 系列;半結構化 → Firestore;非結構化 → Cloud Storage |
| 工作負載 | 交易型(OLTP)?分析型(OLAP)? | OLTP → Cloud SQL / AlloyDB / Spanner;OLAP → BigQuery |
| 擴展需求 | 單區域夠用?需要全球部署? | 區域 → Cloud SQL / AlloyDB;全球 → Spanner |
| 規模量級 | GB?TB?PB? | GB → Cloud SQL;TB → AlloyDB;PB → Spanner / BigQuery / Bigtable |
| 計費模式 | 固定成本可預測?按用量彈性? | 固定 → 預配容量;彈性 → BigQuery 隨用隨付 / Cloud Run |
| 特殊需求 | 向量搜尋?即時同步?時序資料? | 向量 → AlloyDB;即時 → Firestore;時序 → Bigtable |
實戰情境
情境一:電商商品目錄系統
需求: 百萬級商品、複雜查詢(分類/篩選/全文搜尋)、讀取為主、加上 AI 推薦引擎
架構選型: AlloyDB 作為主要資料庫(PostgreSQL 相容 + 向量嵌入支援推薦引擎),搭配 Memorystore 快取熱門商品,商品圖片存放在 Cloud Storage(啟用 Autoclass)。
情境二:全球金融交易平台
需求: 跨 3 大洲即時交易、強一致性、99.999% 可用性、每秒萬筆交易
架構選型: Cloud Spanner(多區域配置保證全球強一致性),交易日誌串流至 BigQuery 進行風控分析,使用 Dataflow 進行即時異常偵測管線。
情境三:IoT 感測器資料平台
需求: 10 萬台設備每秒回傳資料、時序資料儲存 3 年、即時儀表板 + 歷史趨勢分析
架構選型: 設備資料透過 Pub/Sub 匯入,Dataflow 串流處理後寫入 Bigtable(即時查詢)和 BigQuery(歷史分析),原始資料歸檔至 Cloud Storage Coldline。
💡 考試小提示:PCA 考試的儲存選型題通常不會只問你選哪一個服務,而是要你設計完整的資料架構——包含主資料庫、快取層、分析層和歸檔策略。練習時養成「全鏈路思考」的習慣。
重點整理
- Cloud Storage 四種類別對應不同存取頻率,Autoclass 自動優化、Lifecycle Policy 手動控制
- AlloyDB 是 v6.1 新增重點:PostgreSQL 相容、4 倍效能、原生向量嵌入
- Cloud Spanner 唯一提供全球強一致性 + 水平擴展的關聯式資料庫,SLA 99.999%
- BigQuery 身兼資料倉儲與 ML 平台,題目出現「分析」幾乎必選
- Dataflow 統一串流與批次處理,是 GCP 資料管線的核心引擎
- 選型決策從資料結構、工作負載、擴展需求、規模量級、計費模式五個維度切入
下一步
在下一課中,我們將學習如何從業務需求出發,運用 Architecture Framework 和 trade-off 分析做出最佳架構決策,掌握 PCA 案例題的核心思維。