大型語言模型導論

大型語言模型導論

2025-10-14 2min Bobo Chen

課程概述

大型語言模型（Large Language Model, LLM）大概是生成式 AI 裡最具代表性的技術了。這堂課會帶你走過 LLM 從預訓練到部署的整個流程，認識幾種不同的模型調整方式，也看看 Google Cloud 的 LLM 產品線各自適合什麼開發需求。

你將學到

說明 LLM 的訓練流程：預訓練、指令微調與 RLHF
區分 Prompt Tuning、Parameter-Efficient Fine-tuning 與 Full Fine-tuning
理解 LLM 的關鍵參數：Temperature、Top-K、Top-P 對輸出的影響
認識 Google Cloud 的 LLM 產品：Gemini、PaLM 2 及 Model Garden 中的開源模型

核心概念

LLM 的訓練三階段

LLM 的訓練通常分三個階段。第一階段是「預訓練」（Pre-training），讓模型在海量文本上學語言的統計模式。第二階段是「指令微調」（Instruction Tuning），餵它精選過的指令-回應配對，教它學會聽人話、照指令做事。最後是「RLHF」（Reinforcement Learning from Human Feedback），用人類的偏好回饋再把模型行為校準一次，盡量減少有害或有偏誤的輸出。

模型調整技術的光譜

從最輕量到最重量的調整方式：

調整方式	訓練資料量	運算成本	適用場景
Prompt Engineering	不需訓練	零成本	一般性任務、快速原型
Prompt Tuning	數百至數千筆	低	特定任務的輸出風格調整
LoRA / Adapter Tuning	數千至數萬筆	中	領域特化，保留通用能力
Full Fine-tuning	數萬筆以上	高	全面轉換模型行為

生成參數的調控

Temperature 管的是輸出有多隨機：調低（像 0.2）回答會更確定、更保守，適合查事實；調高（像 0.8）就比較有創意、變化多。Top-K 限制每次取樣時要考慮幾個候選詞，Top-P（Nucleus Sampling）則是設一個累積機率的門檻。這幾個參數怎麼搭，直接影響輸出的品質和風格。

Google Cloud LLM 產品定位

Gemini 是 Google 目前的旗艦多模態基礎模型，文字、圖片、影片、程式碼都能當輸入。PaLM 2 是前一代的旗艦文字模型，已於 2025-04-09 在 Vertex AI 上退役（text-bison／Codey 等版本同步淘汰），請改用 Gemini。Model Garden 則收了第三方和開源模型（像 Llama、Mistral），可以直接在 Vertex AI 上部署。（另註：Google 已於 2026 年 4-5 月將 Vertex AI 整合改名為 Gemini Enterprise Agent Platform，Model Garden 沿用原名、僅併入新主控台架構，本文沿用課程原名撰寫。）

實作重點

在 Vertex AI Studio 中嘗試調整 Temperature、Top-K 與 Top-P 參數，觀察同一個 prompt 在不同設定下的輸出差異
比較 Gemini Pro 與 Gemini Flash 在相同任務下的回應速度與品質（截至 2026 年中，Google 已迭代到 Gemini 3 系列，Pro／Flash 分層邏輯不變）
了解 Token 的概念：模型的輸入輸出都以 Token 為單位計費，中文字通常消耗較多 Token
注意模型的 Context Window（上下文視窗）大小，這決定了單次請求能處理的最大內容量

Lab 導讀

Lab 連結：Introduction to Large Language Models — Google Cloud Skills Boost

這個 Lab 一樣是影片教學加測驗的格式。重點先掌握 LLM 的幾個定義特徵（大規模訓練資料、海量參數、Transformer 架構），還有不同微調方式各自適合用在哪。測驗常考 Prompt Tuning 跟 Full Fine-tuning 差在哪，以及 Temperature 會把輸出往哪個方向帶。

延伸學習

概念深入：什麼是生成式 AI？ — 回顧 AI 基礎概念
負責任的 AI 導論 — 了解使用 LLM 時的倫理考量
Vertex AI Prompt 設計 — 學習如何設計有效的 Prompt

Study Jam：GenAI 開發者實戰 — 2/29 完成查看系列全覽 →

經典架構拆解 · 01 — Netflix 全球串流架構

經典架構拆解 · 02 — Uber 即時派單架構

經典架構拆解 · 03 — Stripe API 冪等性設計

課程概述

你將學到

核心概念

實作重點

Lab 導讀

延伸學習

留言討論

歡迎來到登雲學院

你的雲端經驗？

你的目標認證？

每天能學多久？

你的學習計畫準備好了！

課程概述

你將學到

核心概念

實作重點

Lab 導讀

延伸學習

相關文章

大型語言模型導論

Gemini 開發者指南

GenAI 應用轉化工作模式

相關學習資源

留言討論