跳至主要內容
ESC
Study Jam:GenAI 開發者實戰 — 第 28/29 篇

負責任 AI:隱私與安全

GCP

課程概述

AI 系統會處理大量使用者資料,怎麼一邊拿這些資料訓練模型、一邊又保護好個人隱私,是每個 AI 開發者躲不掉的課題。這堂課從訓練階段的差分隱私一路講到部署階段的 VPC 安全控管,帶你在 Google Cloud 上做出兼顧隱私與安全的 AI 應用。

你將學到

  • 理解 AI 系統面臨的隱私威脅:模型反推、成員推論、資料投毒
  • 掌握差分隱私(Differential Privacy)的核心概念與應用
  • 使用 Cloud DLP API 在 AI 管線中自動偵測與遮蔽敏感資料
  • 運用 VPC Service Controls 建立 AI 工作負載的安全邊界
  • 了解 Google Cloud 的資料處理承諾與合規認證

核心概念

AI 系統的隱私威脅

AI 模型有時會在不知不覺中洩露訓練資料裡的隱私資訊。常見的攻擊手法有幾種:模型反推攻擊(Model Inversion)——反覆查詢模型,慢慢推導出訓練資料中某個人的特徵。成員推論攻擊(Membership Inference)——判斷某筆資料到底有沒有被拿去訓練。Prompt Injection——在生成式 AI 裡用精心設計的輸入,誘導模型把系統指令或訓練資料吐出來。資料投毒(Data Poisoning)——在訓練資料裡塞惡意樣本,讓模型產生偏差,甚至留下後門。

差分隱私(Differential Privacy)

差分隱私是一套數學框架,目的是讓模型訓練不會洩露任何單一個人的資訊。核心做法是在訓練過程中加入校準過的噪聲:就算多放一個人的資料進去,模型輸出的變化也要小到偵測不出來。Google 自家不少產品都用了差分隱私(像是 Chrome 瀏覽器收遙測資料),而 TensorFlow Privacy 程式庫也提供差分隱私版本的 SGD 最佳化器。

機密資料保護(Sensitive Data Protection,原 Cloud DLP)的角色

機密資料保護(Sensitive Data Protection,原 Cloud DLP)底下的 Cloud Data Loss Prevention API(DLP API),可以自動偵測、分類、遮蔽超過 200 種敏感資訊類型(身分證號碼、信用卡號、電子郵件、地址等)。在 AI 管線裡,DLP API 有兩個該擺的位置:訓練前的資料前處理(確保訓練資料不含明文的個人資訊),以及推論後的輸出過濾(確保模型回應不會把敏感資訊漏出去)。

VPC Service Controls

VPC Service Controls 會幫 Google Cloud 服務圍出一道安全邊界,防止資料外洩。在 AI 場景裡,你可以把 Vertex AI、Cloud Storage、BigQuery 這些服務都圈進同一個安全邊界,確保訓練資料和模型不會被沒授權的專案或網路存取。就算哪天 IAM 權限不小心設錯,VPC SC 還能當最後一道防線。

Google Cloud 的隱私承諾

Google Cloud 對企業客戶的資料處理講得很清楚:客戶資料不會拿去訓練 Google 的通用模型;Vertex AI 上的 Fine-tuning 資料完全由客戶自己掌控;資料不管在傳輸中還是靜態時都會加密。這些承諾都白紙黑字寫在 Google Cloud 的 Data Processing Addendum(DPA)裡。

實作重點

  • 使用 Cloud DLP API 掃描一組文件,找出其中的敏感資訊並自動遮蔽
  • 在 Vertex AI 的訓練管線前加入 DLP 前處理步驟,確保訓練資料的隱私合規
  • 設定 VPC Service Controls 安全邊界,將 Vertex AI 服務納入保護範圍
  • 測試 Prompt Injection 攻擊:嘗試讓 GenAI 應用洩露 System Instruction 的內容
  • 檢視 Google Cloud 的合規頁面,確認你的 AI 應用所需的認證(如 ISO 27001、SOC 2)

Lab 導讀

Lab 連結Responsible AI for Developers: Privacy & Safety — Google Cloud Skills Boost

這個 Lab 以實際的安全場景出發,帶你用 DLP API 和安全工具保護 AI 系統。測驗重點有幾個:各種隱私威脅的類型和對應的防禦招式、差分隱私的核心概念、DLP API 的使用場景,還有 VPC Service Controls 怎麼運作。建議特別留意 Prompt Injection 的防禦策略,這是 GenAI 時代才冒出來的全新安全挑戰。

延伸學習

Study Jam:GenAI 開發者實戰 — 28/29 完成 查看系列全覽 →

留言討論

徽章解鎖!