跳至主要內容
ESC
跳到課程內容
生成式 AI 基礎 Google Cloud AI 產品全景
0%
2 / 5 初級 25 分鐘 00:00

Google Cloud AI 產品全景

深入探索 Vertex AI、Gemini、Model Garden 等 Google Cloud AI 服務,掌握各產品的定位與適用場景

2026年3月12日 Updated: 2026年3月19日

Google Cloud AI 產品全景

Google Cloud 提供業界最完整的 AI 產品線之一。本課將帶你深入了解每項產品的定位、架構與適用場景,幫助你在實務中做出正確的技術選型。

Vertex AI:端到端 ML 平台

Vertex AI 是 Google Cloud 的統一 ML 平台,整合了從資料準備到模型部署的完整流程:

  • AutoML:無需撰寫程式碼,透過介面訓練自訂模型
  • Custom Training:使用自訂程式碼進行模型訓練,支援 TensorFlow、PyTorch 等框架
  • Model Registry:集中管理所有模型版本
  • Endpoints:一鍵部署模型為即時推論 API
  • Pipelines:自動化 ML 工作流程,實現 MLOps

Vertex AI 的核心價值在於「統一」——你不需要在多個工具之間切換,一個平台就能完成所有 ML 任務。

Gemini 模型家族

Gemini 是 Google 最先進的多模態基礎模型,從設計之初就支援文字、圖片、影片、音訊與程式碼的混合輸入與輸出。Google 持續快速迭代,以下是截至 2026 年 3 月的最新模型陣容:

最新世代(Gemini 3.x)

模型定位適用場景上下文視窗
Gemini 3.1 Pro旗艦級,最強推理與程式碼能力複雜多步驟推理、大型程式碼庫分析、研究200 萬 tokens
Gemini 3.1 Flash速度與智慧的最佳平衡企業級應用、即時對話、內容生成100 萬 tokens

上一世代(仍廣泛使用)

模型定位適用場景上下文視窗
Gemini 2.5 Pro深度推理,成熟穩定程式碼生成、多模態分析100 萬 tokens
Gemini 2.5 Flash高性價比大量請求處理、原生音訊支援100 萬 tokens
Gemini 2.0 Flash輕量快速低延遲即時互動、摘要擷取100 萬 tokens

裝置端

模型定位適用場景
Gemini Nano輕量化、裝置端推論手機與邊緣裝置上的本地推論,無需網路

如何選擇?

你的需求是...

需要最強推理能力或處理超長文本(200 萬 tokens)?
    → Gemini 3.1 Pro

需要快速回應 + 高品質(一般企業場景)?
    → Gemini 3.1 Flash(推薦大多數場景的起點)

需要極低成本處理大量請求?
    → Gemini 2.5 Flash 或 2.0 Flash

需要在手機/邊緣裝置離線運行?
    → Gemini Nano

💡 版本選擇建議:2026 年新專案建議直接使用 Gemini 3.1 Flash 作為起點——它在大多數任務上的表現已超越上一代 Pro,而成本更低。只有在需要最強推理或超長上下文時才升級至 3.1 Pro。

Model Garden:模型市集

Model Garden 提供超過 200 個模型的統一存取入口,包含三大類來源:

  1. Google 自有模型 — Gemini 3.1、Imagen 4、Chirp、Veo(影片生成)等
  2. 開源模型 — Llama 4、Mistral、DeepSeek、Stable Diffusion 等
  3. 第三方合作夥伴模型 — Anthropic Claude 4、AI21 Labs 等

Model Garden 的優勢在於你可以在同一個平台上比較不同模型的表現,快速找到最適合你需求的方案。所有模型都可透過 Vertex AI 的 API 統一呼叫,不需要為每個模型供應商分別設定帳號。

Vertex AI Search:企業級搜尋與 RAG

Vertex AI Search 讓企業能夠在自有資料上建構高品質的搜尋與問答體驗。它的核心架構是 RAG(Retrieval-Augmented Generation,檢索增強生成):

  1. 索引建立 — 將企業文件、網頁、資料庫匯入並建立向量索引
  2. 語意檢索 — 使用者提問時,從索引中找到最相關的文件片段
  3. 生成回答 — 將檢索結果作為上下文,由 LLM 生成精確的回答

適用場景包括:企業知識庫、客戶自助服務、內部文件搜尋。

Vertex AI Agent Builder:建構 AI 代理

Agent Builder 讓開發者能快速建構具備推理、規劃和工具呼叫能力的 AI 代理:

  • 對話式代理 — 處理多輪對話,理解上下文
  • 工具整合 — 連結 API、資料庫、第三方服務
  • Grounding — 將回答錨定在企業自有資料上,減少幻覺
  • 評估框架 — 內建測試與品質評估機制

三大雲端 AI 平台比較(2026 年 3 月)

項目Google Cloud (Vertex AI)Azure OpenAI ServiceAWS Bedrock
主力模型Gemini 3.1 系列GPT-4o、GPT-4.1Claude 4、Titan
多模態支援原生多模態(文字/圖片/影片/音訊/程式碼)透過 GPT-4o依模型而異
模型市集Model Garden(200+ 模型)Azure AI Model CatalogBedrock Model Hub
ML 平台整合深度整合 Vertex AI整合 Azure ML整合 SageMaker
搜尋 / RAGVertex AI SearchAzure AI SearchKendra + Bedrock
AI 代理Vertex AI Agent BuilderAzure AI Agent ServiceBedrock Agents
差異化優勢資料分析(BigQuery)整合企業生態系(M365)整合AWS 基礎設施廣度

產品選型決策指引

面對這麼多產品,該如何選擇?以下是實務建議:

  • 需要現成的 AI 能力? → 直接呼叫 Gemini API
  • 需要在自有資料上建構搜尋? → Vertex AI Search
  • 需要訓練或微調自訂模型? → Vertex AI Custom Training
  • 需要比較不同模型? → Model Garden
  • 需要建構 AI 代理或聊天機器人? → Vertex AI Agent Builder
  • 需要端到端的 ML 工作流程? → Vertex AI Pipelines + MLOps

成本考量

AI 工作負載的成本結構與傳統雲端服務不同,需要特別注意:

  • API 呼叫計費 — 依輸入/輸出 token 數量計費,Gemini 3.1 Flash 的成本約為 3.1 Pro 的十分之一
  • 訓練成本 — 自訂模型訓練依 GPU 時數計費,建議先用小資料集驗證
  • 推論成本 — 線上推論(即時)比批次推論貴,選擇適合的部署方式
  • Context Caching — 對重複使用相同長文本的場景,可啟用上下文快取大幅降低成本
  • 儲存成本 — 模型與資料的儲存費用,大型模型可能佔用數十 GB

💡 成本優化提示:善用 Gemini 3.1 Flash 處理大多數場景,只在需要最強推理能力時才使用 3.1 Pro,可以大幅降低 AI 支出。搭配 Context Caching 和批次推論,成本還能再降 50% 以上。

重點整理

  • Vertex AI 是 Google Cloud 的統一 ML 平台,提供端到端的 AI 開發體驗
  • Gemini 3.1 是最新世代模型——3.1 Flash 適合大多數場景,3.1 Pro 用於最強推理
  • Model Garden 提供 200+ 模型,在同一平台上存取 Google、開源與第三方模型
  • Vertex AI Search 實現 RAG 模式,讓 AI 能在企業資料上精準回答
  • Agent Builder 讓你快速建構具備工具呼叫能力的 AI 代理
  • 選型的關鍵在於平衡效能需求與成本預算——大部分場景從 3.1 Flash 開始

下一步

在下一課中,我們將進入實作環節,學習如何透過 Vertex AI 呼叫 Gemini API,完成你的第一個生成式 AI 應用。

徽章解鎖!