使用 Google Cloud ML API
GCP
課程概述
Google Cloud 提供一系列預訓練的機器學習 API,讓你不用任何 ML 背景,就能把影像辨識、文字分析、語言翻譯這些 AI 能力加進自己的應用。要替 App 加 AI 功能,這大概是最快的一條路:發一個 HTTP 請求,馬上就拿得到分析結果。
你將學到
- 使用 Cloud Vision API 進行影像標籤辨識與 OCR 文字擷取
- 使用 Cloud Natural Language API 分析文字情感與實體辨識
- 使用 Cloud Translation API 實現多語言即時翻譯
- 透過 Cloud Shell 與
curl呼叫 REST API - 理解 API 金鑰與服務帳戶的認證差異
核心概念
預訓練 API vs 自訂模型
Google Cloud 的 ML API 分為兩大類:
| 類型 | 代表服務 | 適用場景 | 門檻 |
|---|---|---|---|
| 預訓練 API | Vision, NL, Translation | 通用辨識、情感分析、翻譯 | 零 ML 經驗 |
| 自訂模型 | AutoML, Vertex AI | 特定領域分類、專業模型 | 需要標註資料 |
這堂課專心講預訓練 API:開箱即用、不用準備訓練資料,按呼叫次數計費。
Cloud Vision API
Vision API 提供多種影像分析功能:
- 標籤偵測(Label Detection) — 辨識圖片中的物件和場景
- 文字偵測(OCR) — 從圖片中擷取文字,支援多語言
- 臉部偵測 — 偵測臉部位置與表情特徵
- 地標偵測 — 辨識知名建築和景點
- SafeSearch — 偵測不當內容
Cloud Natural Language API
NL API 可以幫你拆解文字內容:
- 情感分析(Sentiment Analysis) — 判斷文字的正負面情緒,分數範圍 -1.0 到 1.0
- 實體分析(Entity Analysis) — 識別人名、地名、組織等命名實體
- 語法分析(Syntax Analysis) — 解析句子結構、詞性標註
- 文本分類(Content Classification) — 將文字歸類到預定義主題
Cloud Translation API
Translation API 支援超過 100 種語言的即時翻譯,分成兩個版本:
- Basic(v2) — 簡單翻譯,適合大多數場景
- Advanced(v3) — 支援自訂詞彙表、批次翻譯、模型選擇
實作重點
- 啟用 API 前須先在 GCP Console 的「API 與服務」中啟用對應的 API
- Vision API 的 REST 呼叫格式:
POST https://vision.googleapis.com/v1/images:annotate - NL API 情感分數解讀:
> 0.25為正面、< -0.25為負面、介於之間為中性 - 常見錯誤:超過免費額度未設定計費警示,意外產生高額帳單
- 最佳實踐:用 API 金鑰快速原型測試,生產環境改用服務帳戶 + IAM 精細控管
Skill Badge 指引
Lab 連結:Use Machine Learning APIs on Google Cloud — 完成此 lab 可獲得 Skill Badge
延伸學習
- 基礎 Data、ML 與 AI 任務 — 結合更多 ML 服務完成綜合實作
- Vertex AI 機器學習解決方案 — 預訓練 API 不夠用時,就該學自訂模型了
- Gemini API 搭配 Vertex AI 探索 GenAI — 探索最新的生成式 AI 能力
Study Jam:數據與 AI 基礎 — 3/12 完成
查看系列全覽 →