架構師思維:從「怎麼做」到「為什麼這樣做」
工程師和架構師的最大差異,不在於技術深度,而在於思維方式。工程師問的是「怎麼做」——如何部署一個 GKE 叢集、如何設定 Cloud SQL。架構師問的是「為什麼」——為什麼選擇 GKE 而不是 Cloud Run?為什麼選擇 Cloud SQL 而不是 Cloud Spanner?
PCA 考試測試的正是這種架構師思維。每一道題目的背後,都隱藏著一個核心問題:在這個業務情境下,什麼是最合適的架構決策?
要回答這個問題,你需要掌握三個關鍵能力:
- 需求分析 — 從業務語言翻譯成技術規格
- Trade-off 分析 — 在相互衝突的目標之間做出合理取捨
- 決策論證 — 用數據和框架支撐你的架構選擇
業務需求 vs 技術需求
架構師的第一步,永遠是理解業務需求,然後將其翻譯成可量化的技術指標。
SLA、SLO 與 SLI
這三個術語經常混淆,但在 PCA 考試中必須精確區分:
| 術語 | 全稱 | 定義 | 範例 |
|---|---|---|---|
| SLI | Service Level Indicator | 實際量測的服務指標 | 請求延遲 P99 = 200ms |
| SLO | Service Level Objective | 內部設定的品質目標 | 可用性目標 99.95% |
| SLA | Service Level Agreement | 對外的合約承諾 | 低於 99.9% 退費 10% |
關係很簡單:SLI 是量測值,SLO 是目標值,SLA 是合約值。SLA 通常比 SLO 寬鬆,因為你需要留有緩衝。
可用性目標的真實成本
不同的可用性等級意味著截然不同的架構複雜度和成本:
| 可用性 | 每年最大停機時間 | 架構需求 | 成本倍數 |
|---|---|---|---|
| 99.9%(三個 9) | 8 小時 45 分 | 單區域 + 自動修復 | 1x |
| 99.99%(四個 9) | 52 分鐘 | 多可用區 + 自動容錯移轉 | 2-3x |
| 99.999%(五個 9) | 5 分鐘 | 多區域主動式 + 全球負載平衡 | 5-10x |
RTO 與 RPO
災難復原的兩大關鍵指標:
- RTO(Recovery Time Objective) — 系統恢復運行所需的最長時間
- RPO(Recovery Point Objective) — 可接受的最大資料遺失時間窗口
一家金融機構可能要求 RTO < 15 分鐘、RPO < 1 分鐘,而一個內部報表系統可能接受 RTO = 4 小時、RPO = 24 小時。不同的 RTO/RPO 需求直接決定了備份策略、複寫機制和部署拓撲。
合規需求
PCA 考試經常出現需要考量合規性的情境:
- HIPAA — 醫療資料保護,需要 BAA(Business Associate Agreement)、加密、稽核日誌
- GDPR — 歐盟個資法規,需要資料駐留(Data Residency)、刪除權、同意管理
- PCI DSS — 支付卡產業標準,需要網路隔離、加密傳輸、存取控制
💡 考試小提示:當題目提到特定產業(醫療、金融、零售)或地理區域(歐盟),立刻聯想對應的合規需求,這通常是排除錯誤選項的關鍵。
架構 Trade-off 分析框架
架構設計不存在「完美解」,只有「在特定約束下的最佳解」。以下是 PCA 考試最常出現的 trade-off 維度:
五大核心 Trade-off
| Trade-off | 選項 A | 選項 B | 決策依據 |
|---|---|---|---|
| 成本 vs 效能 | 低成本(E2 VM、Spot) | 高效能(C3、N4) | 工作負載特性與 SLO 要求 |
| 一致性 vs 可用性 | 強一致性(Cloud Spanner) | 最終一致性(Firestore) | 業務對資料即時性的要求 |
| 託管 vs 自管 | 全託管(Cloud Run、BigQuery) | 自管(GKE、Compute Engine) | 團隊能力與客製化需求 |
| 單區域 vs 多區域 | 單區域(低成本、低延遲) | 多區域(高可用、合規) | 可用性目標與資料駐留要求 |
| 遷移速度 vs 風險 | Lift & Shift(快速) | Re-architect(徹底) | 時程壓力與技術債容忍度 |
CAP 定理在 GCP 中的實踐
CAP 定理告訴我們,在分散式系統中,一致性(Consistency)、可用性(Availability)、分區容錯(Partition Tolerance) 三者無法同時完全達成。在 GCP 的世界裡:
- Cloud Spanner — 透過 TrueTime 技術在全球規模提供強一致性,但成本較高
- Firestore — 不論單區域或多區域模式都提供強一致性(多區域以 Paxos 同步複寫到多數副本達成跨區域高可用),是偏 CP 取向的代表服務
- Bigtable — 偏向可用性和分區容錯,最終一致性,適合高吞吐量場景
KPI 與 ROI 分析
架構師不只要設計系統,還要能用業務語言證明架構決策的價值。
TCO(Total Cost of Ownership)計算
評估雲端架構的總擁有成本應包含:
- 直接成本 — 運算、儲存、網路、授權費用
- 營運成本 — 人力、監控工具、事件回應
- 隱性成本 — 技術債、遷移成本、廠商鎖定風險
- 機會成本 — 團隊花在維運上的時間 vs 開發新功能
遷移 ROI 框架
向管理層證明上雲價值時,可以從這些面向量化效益:
- 基礎設施成本節省 — 從自建機房轉向隨需付費
- 營運效率提升 — 自動化取代手動操作、減少事故回應時間
- 商業敏捷度 — 新功能上線時間從數月縮短到數天
- 風險降低 — 改善災難復原能力、符合合規要求
💡 考試小提示:PCA 題目中如果出現「管理層擔心成本」或「需要向利害關係人證明價值」,答案通常指向 TCO 分析或 ROI 論證,而非單純的技術方案。
v6.1 案例研究方法論
PCA 考試每次會從 4 個案例研究中抽出 2 個,案例題約佔考試的 20-30%。掌握系統化的分析方法至關重要。
四步驟解題法
第一步:閱讀情境,標記約束條件
快速掃描案例,用心記下:目前的架構、明確的業務需求、技術限制(如「必須使用 Kubernetes」)、合規要求、預算限制。
第二步:對應 Architecture Framework 六大支柱
將需求分類到六大支柱中——這能幫助你確保沒有遺漏重要面向,也能快速判斷每個選項在哪些支柱上表現較好。
第三步:約束條件排除法
先用硬性約束排除明顯錯誤的選項。例如:題目要求 HIPAA 合規,但某選項使用了不支援 BAA 的服務——直接排除。
第四步:Trade-off 比較,選擇最佳解
剩下的選項用 trade-off 分析比較,選擇最符合題目優先級的方案。注意:最佳答案不一定是技術上最先進的,而是最符合題目情境的。
四大案例研究速覽
| 案例 | 關鍵考點 | 常見陷阱 |
|---|---|---|
| EHR Healthcare | HIPAA 合規、資料加密、混合雲 | 忽略 BAA 要求、選擇不合規的服務 |
| Altostrat Media | 全球 CDN、高併發串流、自動擴縮 | 過度設計單區域部署、忽略延遲需求 |
| Cymbal Retail | AI/ML 推薦、即時庫存、多通路 | 忽略資料一致性、過度使用批次處理 |
| KnightMotives Automotive | IoT 資料攝取、邊緣運算、時序資料 | 忽略頻寬限制、選擇錯誤的資料庫 |
實戰練習:需求分析工作坊
讓我們用一個模擬情境來練習完整的分析流程。
情境: 一家台灣的線上教育平台,目前在自建機房運行,計劃在 6 個月內遷移到 GCP。
- 使用者分布在台灣和東南亞,尖峰時段有 5 萬人同時在線
- 需要即時影音串流和互動功能
- 學員資料需符合台灣個資法
- 年度 IT 預算 300 萬台幣,希望上雲後降低 30% 營運成本
- 團隊有 3 位工程師,無 Kubernetes 經驗
分析步驟:
- 約束條件 — 6 個月時程(排除 Re-architect)、無 K8s 經驗(偏好託管服務)、資料駐留台灣
- 可用性需求 — 教育平台非關鍵任務,99.9% 足夠 → 單區域 + 自動修復
- 運算選型 — 團隊小且無 K8s 經驗 → Cloud Run(全託管)優於 GKE
- 資料庫 — 使用者資料 + 課程內容 → Cloud SQL(MySQL)單區域,符合個資法要求
- 影音 — Cloud CDN + Cloud Storage 存放影片,Media CDN 加速東南亞存取
- 成本控制 — Cloud Run 按使用量計費,搭配 CUD 降低 Cloud SQL 費用
這個分析過程體現了架構師思維的精髓:不是選最強的技術,而是選最合適的方案。
💡 考試小提示:PCA 案例題常常給你「看起來都對」的四個選項。區分正確答案的關鍵,往往是題目中一個不起眼的約束條件——例如團隊規模、時程限制或合規要求。養成標記約束條件的習慣,能大幅提升答題準確率。
重點整理
- 架構師的核心能力是需求翻譯——將業務語言轉化為可量化的技術指標(SLA/SLO/SLI、RTO/RPO)
- 每一個架構決策都是 trade-off,不存在完美解,只有在特定約束下的最佳解
- TCO 和 ROI 分析是向利害關係人證明架構決策價值的關鍵工具
- 案例研究解題四步驟:標記約束 → 對應支柱 → 排除法 → Trade-off 比較
- 最佳答案不是最先進的技術,而是最符合題目情境的方案
下一步
在下一課中,我們將探討遷移規劃與混合雲架構,學習企業上雲遷移的六大策略(6R)、混合雲設計模式,以及 GCP 遷移工具鏈的實戰應用。