跳至主要內容
ESC
Study Jam:數據與 AI 基礎 — 第 7/12 篇

Gemini API 搭配 Vertex AI 探索 GenAI

GCP

課程概述

Gemini 是 Google 最新一代的多模態大語言模型,文字、圖片、影片、音訊都能一起讀懂。透過 Vertex AI,你可以在企業級的安全環境裡呼叫 Gemini API,開發生成式 AI 應用。這門課會先帶你玩 Vertex AI Studio 的圖形介面,再一路講到 API 呼叫和 Prompt 工程的技巧。

你將學到

  • 在 Vertex AI Studio 中使用圖形介面測試 Gemini 模型
  • 透過 REST API 與 Python SDK 呼叫 Gemini API
  • 設計有效的 Prompt,包含 Zero-shot 與 Few-shot 技巧
  • 使用多模態功能分析圖片與文件
  • 理解 Gemini 模型家族的差異與選擇策略

核心概念

Gemini 模型家族

模型特色適用場景速度成本
Gemini Flash速度最快、最便宜大量請求、即時互動極快
Gemini Pro推理能力最強複雜分析、長文本中等
Gemini NanoAndroid 裝置端推論行動裝置、邊緣運算(不在本課程範圍)取決於裝置無雲端成本

注意:Gemini Nano 僅供 Android 裝置端使用(透過 AICore / ML Kit GenAI),無法透過 Vertex AI 或 Gemini API 呼叫。本課程聚焦於 Vertex AI,實際可選用的是 Flash 與 Pro。

大多數場景建議從 Flash 開始,只有在效果不佳時才考慮升級到 Pro。

Vertex AI Studio

Vertex AI Studio 是 Google Cloud Console 裡的圖形化 GenAI 開發環境,不用寫任何程式碼就能:

  • 測試不同 Prompt 並比較回應品質
  • 調整溫度(Temperature)、Top-K、Top-P 等參數
  • 上傳圖片測試多模態能力
  • 一鍵取得對應的 API 呼叫程式碼

Prompt 設計基礎

Prompt 寫得好不好,幾乎決定了 GenAI 應用的成敗。幾個核心技巧:

  • 角色設定 — 告訴模型「你是一位…」,框定回答範圍
  • 明確指令 — 具體說明期望的格式、長度、語言
  • Zero-shot — 直接提問,不提供範例
  • Few-shot — 提供 2-3 個輸入/輸出範例,引導模型學習模式
  • Chain-of-thought — 要求模型「一步一步思考」,提升推理品質

多模態能力

Gemini 原生就支援多模態,意思是你可以在同一個請求裡混搭好幾種輸入:

  • 上傳一張架構圖,要求 Gemini 分析並提出改善建議
  • 傳入一段影片,請 Gemini 摘要關鍵內容
  • 結合文字描述與參考圖片,生成更精確的回應

實作重點

  • 在 Vertex AI Studio 測試好 Prompt 後,可點擊「取得程式碼」直接複製 Python / curl 範例
  • API 呼叫需先啟用 Vertex AI API,並設定正確的 GCP 專案與區域
  • 溫度參數:0.0 適合事實型任務(翻譯、摘要),0.7-1.0 適合創意型任務(寫作、腦力激盪)
  • 常見錯誤:Prompt 過於模糊導致回應品質不穩定,應加入明確的限制條件
  • 安全性:生產環境務必透過 VPC Service Controls 限制 API 存取範圍

Skill Badge 指引

Lab 連結Explore Generative AI with the Gemini API in Vertex AI — 完成此 lab 可獲得 Skill Badge

延伸學習

Study Jam:數據與 AI 基礎 — 7/12 完成 查看系列全覽 →

留言討論

徽章解鎖!