Google Cloud AI 產品全景
Google Cloud 提供業界最完整的 AI 產品線之一。本課將帶你深入了解每項產品的定位、架構與適用場景,幫助你在實務中做出正確的技術選型。
Vertex AI:端到端 ML 平台
Vertex AI 是 Google Cloud 的統一 ML 平台,整合了從資料準備到模型部署的完整流程:
- AutoML:無需撰寫程式碼,透過介面訓練自訂模型
- Custom Training:使用自訂程式碼進行模型訓練,支援 TensorFlow、PyTorch 等框架
- Model Registry:集中管理所有模型版本
- Endpoints:一鍵部署模型為即時推論 API
- Pipelines:自動化 ML 工作流程,實現 MLOps
Vertex AI 的核心價值在於「統一」——你不需要在多個工具之間切換,一個平台就能完成所有 ML 任務。
Gemini 模型家族
Gemini 是 Google 最先進的多模態基礎模型,從設計之初就支援文字、圖片、影片、音訊與程式碼的混合輸入與輸出。Google 持續快速迭代,以下是截至 2026 年 3 月的最新模型陣容:
最新世代(Gemini 3.x)
| 模型 | 定位 | 適用場景 | 上下文視窗 |
|---|---|---|---|
| Gemini 3.1 Pro | 旗艦級,最強推理與程式碼能力 | 複雜多步驟推理、大型程式碼庫分析、研究 | 200 萬 tokens |
| Gemini 3.1 Flash | 速度與智慧的最佳平衡 | 企業級應用、即時對話、內容生成 | 100 萬 tokens |
上一世代(仍廣泛使用)
| 模型 | 定位 | 適用場景 | 上下文視窗 |
|---|---|---|---|
| Gemini 2.5 Pro | 深度推理,成熟穩定 | 程式碼生成、多模態分析 | 100 萬 tokens |
| Gemini 2.5 Flash | 高性價比 | 大量請求處理、原生音訊支援 | 100 萬 tokens |
| Gemini 2.0 Flash | 輕量快速 | 低延遲即時互動、摘要擷取 | 100 萬 tokens |
裝置端
| 模型 | 定位 | 適用場景 |
|---|---|---|
| Gemini Nano | 輕量化、裝置端推論 | 手機與邊緣裝置上的本地推論,無需網路 |
如何選擇?
你的需求是...
↓
需要最強推理能力或處理超長文本(200 萬 tokens)?
→ Gemini 3.1 Pro
需要快速回應 + 高品質(一般企業場景)?
→ Gemini 3.1 Flash(推薦大多數場景的起點)
需要極低成本處理大量請求?
→ Gemini 2.5 Flash 或 2.0 Flash
需要在手機/邊緣裝置離線運行?
→ Gemini Nano
💡 版本選擇建議:2026 年新專案建議直接使用 Gemini 3.1 Flash 作為起點——它在大多數任務上的表現已超越上一代 Pro,而成本更低。只有在需要最強推理或超長上下文時才升級至 3.1 Pro。
Model Garden:模型市集
Model Garden 提供超過 200 個模型的統一存取入口,包含三大類來源:
- Google 自有模型 — Gemini 3.1、Imagen 4、Chirp、Veo(影片生成)等
- 開源模型 — Llama 4、Mistral、DeepSeek、Stable Diffusion 等
- 第三方合作夥伴模型 — Anthropic Claude 4、AI21 Labs 等
Model Garden 的優勢在於你可以在同一個平台上比較不同模型的表現,快速找到最適合你需求的方案。所有模型都可透過 Vertex AI 的 API 統一呼叫,不需要為每個模型供應商分別設定帳號。
Vertex AI Search:企業級搜尋與 RAG
Vertex AI Search 讓企業能夠在自有資料上建構高品質的搜尋與問答體驗。它的核心架構是 RAG(Retrieval-Augmented Generation,檢索增強生成):
- 索引建立 — 將企業文件、網頁、資料庫匯入並建立向量索引
- 語意檢索 — 使用者提問時,從索引中找到最相關的文件片段
- 生成回答 — 將檢索結果作為上下文,由 LLM 生成精確的回答
適用場景包括:企業知識庫、客戶自助服務、內部文件搜尋。
Vertex AI Agent Builder:建構 AI 代理
Agent Builder 讓開發者能快速建構具備推理、規劃和工具呼叫能力的 AI 代理:
- 對話式代理 — 處理多輪對話,理解上下文
- 工具整合 — 連結 API、資料庫、第三方服務
- Grounding — 將回答錨定在企業自有資料上,減少幻覺
- 評估框架 — 內建測試與品質評估機制
三大雲端 AI 平台比較(2026 年 3 月)
| 項目 | Google Cloud (Vertex AI) | Azure OpenAI Service | AWS Bedrock |
|---|---|---|---|
| 主力模型 | Gemini 3.1 系列 | GPT-4o、GPT-4.1 | Claude 4、Titan |
| 多模態支援 | 原生多模態(文字/圖片/影片/音訊/程式碼) | 透過 GPT-4o | 依模型而異 |
| 模型市集 | Model Garden(200+ 模型) | Azure AI Model Catalog | Bedrock Model Hub |
| ML 平台整合 | 深度整合 Vertex AI | 整合 Azure ML | 整合 SageMaker |
| 搜尋 / RAG | Vertex AI Search | Azure AI Search | Kendra + Bedrock |
| AI 代理 | Vertex AI Agent Builder | Azure AI Agent Service | Bedrock Agents |
| 差異化優勢 | 資料分析(BigQuery)整合 | 企業生態系(M365)整合 | AWS 基礎設施廣度 |
產品選型決策指引
面對這麼多產品,該如何選擇?以下是實務建議:
- 需要現成的 AI 能力? → 直接呼叫 Gemini API
- 需要在自有資料上建構搜尋? → Vertex AI Search
- 需要訓練或微調自訂模型? → Vertex AI Custom Training
- 需要比較不同模型? → Model Garden
- 需要建構 AI 代理或聊天機器人? → Vertex AI Agent Builder
- 需要端到端的 ML 工作流程? → Vertex AI Pipelines + MLOps
成本考量
AI 工作負載的成本結構與傳統雲端服務不同,需要特別注意:
- API 呼叫計費 — 依輸入/輸出 token 數量計費,Gemini 3.1 Flash 的成本約為 3.1 Pro 的十分之一
- 訓練成本 — 自訂模型訓練依 GPU 時數計費,建議先用小資料集驗證
- 推論成本 — 線上推論(即時)比批次推論貴,選擇適合的部署方式
- Context Caching — 對重複使用相同長文本的場景,可啟用上下文快取大幅降低成本
- 儲存成本 — 模型與資料的儲存費用,大型模型可能佔用數十 GB
💡 成本優化提示:善用 Gemini 3.1 Flash 處理大多數場景,只在需要最強推理能力時才使用 3.1 Pro,可以大幅降低 AI 支出。搭配 Context Caching 和批次推論,成本還能再降 50% 以上。
重點整理
- Vertex AI 是 Google Cloud 的統一 ML 平台,提供端到端的 AI 開發體驗
- Gemini 3.1 是最新世代模型——3.1 Flash 適合大多數場景,3.1 Pro 用於最強推理
- Model Garden 提供 200+ 模型,在同一平台上存取 Google、開源與第三方模型
- Vertex AI Search 實現 RAG 模式,讓 AI 能在企業資料上精準回答
- Agent Builder 讓你快速建構具備工具呼叫能力的 AI 代理
- 選型的關鍵在於平衡效能需求與成本預算——大部分場景從 3.1 Flash 開始
下一步
在下一課中,我們將進入實作環節,學習如何透過 Vertex AI 呼叫 Gemini API,完成你的第一個生成式 AI 應用。