Gemini API 搭配 Vertex AI 探索 GenAI
GCP
課程概述
Gemini 是 Google 最新一代的多模態大語言模型,文字、圖片、影片、音訊都能一起讀懂。透過 Vertex AI,你可以在企業級的安全環境裡呼叫 Gemini API,開發生成式 AI 應用。這門課會先帶你玩 Vertex AI Studio 的圖形介面,再一路講到 API 呼叫和 Prompt 工程的技巧。
你將學到
- 在 Vertex AI Studio 中使用圖形介面測試 Gemini 模型
- 透過 REST API 與 Python SDK 呼叫 Gemini API
- 設計有效的 Prompt,包含 Zero-shot 與 Few-shot 技巧
- 使用多模態功能分析圖片與文件
- 理解 Gemini 模型家族的差異與選擇策略
核心概念
Gemini 模型家族
| 模型 | 特色 | 適用場景 | 速度 | 成本 |
|---|---|---|---|---|
| Gemini Flash | 速度最快、最便宜 | 大量請求、即時互動 | 極快 | 低 |
| Gemini Pro | 推理能力最強 | 複雜分析、長文本 | 中等 | 中 |
| Gemini Nano | Android 裝置端推論 | 行動裝置、邊緣運算(不在本課程範圍) | 取決於裝置 | 無雲端成本 |
注意:Gemini Nano 僅供 Android 裝置端使用(透過 AICore / ML Kit GenAI),無法透過 Vertex AI 或 Gemini API 呼叫。本課程聚焦於 Vertex AI,實際可選用的是 Flash 與 Pro。
大多數場景建議從 Flash 開始,只有在效果不佳時才考慮升級到 Pro。
Vertex AI Studio
Vertex AI Studio 是 Google Cloud Console 裡的圖形化 GenAI 開發環境,不用寫任何程式碼就能:
- 測試不同 Prompt 並比較回應品質
- 調整溫度(Temperature)、Top-K、Top-P 等參數
- 上傳圖片測試多模態能力
- 一鍵取得對應的 API 呼叫程式碼
Prompt 設計基礎
Prompt 寫得好不好,幾乎決定了 GenAI 應用的成敗。幾個核心技巧:
- 角色設定 — 告訴模型「你是一位…」,框定回答範圍
- 明確指令 — 具體說明期望的格式、長度、語言
- Zero-shot — 直接提問,不提供範例
- Few-shot — 提供 2-3 個輸入/輸出範例,引導模型學習模式
- Chain-of-thought — 要求模型「一步一步思考」,提升推理品質
多模態能力
Gemini 原生就支援多模態,意思是你可以在同一個請求裡混搭好幾種輸入:
- 上傳一張架構圖,要求 Gemini 分析並提出改善建議
- 傳入一段影片,請 Gemini 摘要關鍵內容
- 結合文字描述與參考圖片,生成更精確的回應
實作重點
- 在 Vertex AI Studio 測試好 Prompt 後,可點擊「取得程式碼」直接複製 Python / curl 範例
- API 呼叫需先啟用 Vertex AI API,並設定正確的 GCP 專案與區域
- 溫度參數:0.0 適合事實型任務(翻譯、摘要),0.7-1.0 適合創意型任務(寫作、腦力激盪)
- 常見錯誤:Prompt 過於模糊導致回應品質不穩定,應加入明確的限制條件
- 安全性:生產環境務必透過 VPC Service Controls 限制 API 存取範圍
Skill Badge 指引
Lab 連結:Explore Generative AI with the Gemini API in Vertex AI — 完成此 lab 可獲得 Skill Badge
延伸學習
- Gemini 輔助數據分析 — 將 Gemini 應用在資料分析場景
- 在 BigQuery 中使用 Gemini 模型 — 在 SQL 查詢中直接呼叫 Gemini
- GCP GenAI 課程:Prompt Engineering — 把進階 Prompt 工程技巧再練熟一點
Study Jam:數據與 AI 基礎 — 7/12 完成
查看系列全覽 →