探索 GenAI 生態系統
課程概述
生成式 AI 的生態系統演化得很快,從基礎模型開發商、雲端平台、中間件到終端應用,已經長成一個多層次的產業結構。這堂課帶你把整個生態系統看過一遍,搞懂各家參與者扮演什麼角色、彼此怎麼競爭,也看看 Google Cloud 怎麼在裡面提供端到端的開發者體驗。
你將學到
- 描述 GenAI 生態系統的四層架構:基礎設施、模型、平台、應用
- 比較主流基礎模型的特色與適用場景
- 解釋 Google Cloud Model Garden 的定位與開放策略
- 評估開源模型與商用模型在不同場景下的取捨
核心概念
GenAI 生態系統四層架構
生態系統由下而上可以分成四層。最底層是基礎設施層,包括 GPU/TPU 硬體跟雲端運算服務。往上是模型層,也就是各家推出的基礎模型(Gemini、GPT、Claude、Llama 等)。再上去是平台層,負責模型部署、調優、監控的中間件(Vertex AI、Azure OpenAI 等)。最上面是應用層,直接面向終端使用者的產品跟解決方案。
Google Cloud 的全棧優勢
Google Cloud 這四層都有布局:TPU 硬體撐起高效能的 AI 運算基礎設施;Gemini 系列從大到小都有,涵蓋不同規模的基礎模型;Vertex AI 把 MLOps 平台統一起來;而 Workspace AI、Gemini Code Assist 則是直接給使用者用的應用。從底層硬體一路串到應用,這套垂直整合讓 Google Cloud 的開發者體驗更連貫。
Model Garden:模型的百貨公司
Vertex AI Model Garden 把 Google 自研模型、第三方商用模型跟開源模型全都收在一起,用同一套介面就能探索、測試、部署。開發者不會被單一模型綁死,可以照任務需求挑最合適的,甚至在同一個應用裡混搭好幾個模型。這種開放策略大幅降低 vendor lock-in 的風險。
開源 vs 商用模型的抉擇
| 考量因素 | 開源模型(Llama, Mistral) | 商用模型(Gemini, GPT) |
|---|---|---|
| 成本 | 推論成本可能較低 | API 按量計費 |
| 自主性 | 完全控制,可自行部署 | 依賴供應商的 API |
| 效能 | 特定任務可達商用水準 | 通常在通用任務表現更好 |
| 合規 | 需自行處理安全與合規 | 平台內建安全機制 |
| 維護 | 需自行管理更新與部署 | 供應商負責維護 |
實作重點
- 瀏覽 Vertex AI Model Garden,按類別(文字、圖片、程式碼、嵌入)篩選模型
- 比較同類型模型的規格:參數量、Context Window、支援語言、授權條款
- 注意 Google Cloud 的 TPU 定價與 GPU(NVIDIA A100 / H100)的差異
- 了解 Vertex AI Endpoints 如何部署開源模型,以及自動擴展的設定方式
Lab 導讀
Lab 連結:Gen AI: Navigate the Landscape — Google Cloud Skills Boost
這個 Lab 是從產業分析的角度帶你認識 GenAI 生態系統。測驗會考你懂不懂各個模型的定位、Google Cloud 產品怎麼對應,還有特定場景下該怎麼挑模型跟平台。建議邊看邊整理一張「模型選擇決策表」,照任務類型、成本、合規需求這幾個維度分類,之後查起來會很省力。
延伸學習
- GenAI 應用轉化工作模式 — 了解 GenAI 如何在工作場域落地
- GenAI Agent 轉型組織 — AI Agent 如何改變組織運作
- Google Cloud AI/ML 概論 — Google Cloud AI/ML 產品的技術深潛