跳至主要內容
ESC
Study Jam:GenAI 開發者實戰 — 第 8/29 篇

探索 GenAI 生態系統

GCP

課程概述

生成式 AI 的生態系統演化得很快,從基礎模型開發商、雲端平台、中間件到終端應用,已經長成一個多層次的產業結構。這堂課帶你把整個生態系統看過一遍,搞懂各家參與者扮演什麼角色、彼此怎麼競爭,也看看 Google Cloud 怎麼在裡面提供端到端的開發者體驗。

你將學到

  • 描述 GenAI 生態系統的四層架構:基礎設施、模型、平台、應用
  • 比較主流基礎模型的特色與適用場景
  • 解釋 Google Cloud Model Garden 的定位與開放策略
  • 評估開源模型與商用模型在不同場景下的取捨

核心概念

GenAI 生態系統四層架構

生態系統由下而上可以分成四層。最底層是基礎設施層,包括 GPU/TPU 硬體跟雲端運算服務。往上是模型層,也就是各家推出的基礎模型(Gemini、GPT、Claude、Llama 等)。再上去是平台層,負責模型部署、調優、監控的中間件(Vertex AI、Azure OpenAI 等)。最上面是應用層,直接面向終端使用者的產品跟解決方案。

Google Cloud 的全棧優勢

Google Cloud 這四層都有布局:TPU 硬體撐起高效能的 AI 運算基礎設施;Gemini 系列從大到小都有,涵蓋不同規模的基礎模型;Vertex AI 把 MLOps 平台統一起來;而 Workspace AI、Gemini Code Assist 則是直接給使用者用的應用。從底層硬體一路串到應用,這套垂直整合讓 Google Cloud 的開發者體驗更連貫。

Model Garden:模型的百貨公司

Vertex AI Model Garden 把 Google 自研模型、第三方商用模型跟開源模型全都收在一起,用同一套介面就能探索、測試、部署。開發者不會被單一模型綁死,可以照任務需求挑最合適的,甚至在同一個應用裡混搭好幾個模型。這種開放策略大幅降低 vendor lock-in 的風險。

開源 vs 商用模型的抉擇

考量因素開源模型(Llama, Mistral)商用模型(Gemini, GPT)
成本推論成本可能較低API 按量計費
自主性完全控制,可自行部署依賴供應商的 API
效能特定任務可達商用水準通常在通用任務表現更好
合規需自行處理安全與合規平台內建安全機制
維護需自行管理更新與部署供應商負責維護

實作重點

  • 瀏覽 Vertex AI Model Garden,按類別(文字、圖片、程式碼、嵌入)篩選模型
  • 比較同類型模型的規格:參數量、Context Window、支援語言、授權條款
  • 注意 Google Cloud 的 TPU 定價與 GPU(NVIDIA A100 / H100)的差異
  • 了解 Vertex AI Endpoints 如何部署開源模型,以及自動擴展的設定方式

Lab 導讀

Lab 連結Gen AI: Navigate the Landscape — Google Cloud Skills Boost

這個 Lab 是從產業分析的角度帶你認識 GenAI 生態系統。測驗會考你懂不懂各個模型的定位、Google Cloud 產品怎麼對應,還有特定場景下該怎麼挑模型跟平台。建議邊看邊整理一張「模型選擇決策表」,照任務類型、成本、合規需求這幾個維度分類,之後查起來會很省力。

延伸學習

Study Jam:GenAI 開發者實戰 — 8/29 完成 查看系列全覽 →

留言討論

徽章解鎖!