跳至主要內容
ESC
Study Jam:GenAI 開發者實戰 — 第 2/29 篇

大型語言模型導論

GCP

課程概述

大型語言模型(Large Language Model, LLM)大概是生成式 AI 裡最具代表性的技術了。這堂課會帶你走過 LLM 從預訓練到部署的整個流程,認識幾種不同的模型調整方式,也看看 Google Cloud 的 LLM 產品線各自適合什麼開發需求。

你將學到

  • 說明 LLM 的訓練流程:預訓練、指令微調與 RLHF
  • 區分 Prompt Tuning、Parameter-Efficient Fine-tuning 與 Full Fine-tuning
  • 理解 LLM 的關鍵參數:Temperature、Top-K、Top-P 對輸出的影響
  • 認識 Google Cloud 的 LLM 產品:Gemini、PaLM 2 及 Model Garden 中的開源模型

核心概念

LLM 的訓練三階段

LLM 的訓練通常分三個階段。第一階段是「預訓練」(Pre-training),讓模型在海量文本上學語言的統計模式。第二階段是「指令微調」(Instruction Tuning),餵它精選過的指令-回應配對,教它學會聽人話、照指令做事。最後是「RLHF」(Reinforcement Learning from Human Feedback),用人類的偏好回饋再把模型行為校準一次,盡量減少有害或有偏誤的輸出。

模型調整技術的光譜

從最輕量到最重量的調整方式:

調整方式訓練資料量運算成本適用場景
Prompt Engineering不需訓練零成本一般性任務、快速原型
Prompt Tuning數百至數千筆特定任務的輸出風格調整
LoRA / Adapter Tuning數千至數萬筆領域特化,保留通用能力
Full Fine-tuning數萬筆以上全面轉換模型行為

生成參數的調控

Temperature 管的是輸出有多隨機:調低(像 0.2)回答會更確定、更保守,適合查事實;調高(像 0.8)就比較有創意、變化多。Top-K 限制每次取樣時要考慮幾個候選詞,Top-P(Nucleus Sampling)則是設一個累積機率的門檻。這幾個參數怎麼搭,直接影響輸出的品質和風格。

Google Cloud LLM 產品定位

Gemini 是 Google 目前的旗艦多模態基礎模型,文字、圖片、影片、程式碼都能當輸入。PaLM 2 是前一代的旗艦文字模型,現在已經在 Vertex AI 上淘汰(deprecated)了,請改用 Gemini。Model Garden 則收了第三方和開源模型(像 Llama、Mistral),可以直接在 Vertex AI 上部署。

實作重點

  • 在 Vertex AI Studio 中嘗試調整 Temperature、Top-K 與 Top-P 參數,觀察同一個 prompt 在不同設定下的輸出差異
  • 比較 Gemini Pro 與 Gemini Flash 在相同任務下的回應速度與品質
  • 了解 Token 的概念:模型的輸入輸出都以 Token 為單位計費,中文字通常消耗較多 Token
  • 注意模型的 Context Window(上下文視窗)大小,這決定了單次請求能處理的最大內容量

Lab 導讀

Lab 連結Introduction to Large Language Models — Google Cloud Skills Boost

這個 Lab 一樣是影片教學加測驗的格式。重點先掌握 LLM 的幾個定義特徵(大規模訓練資料、海量參數、Transformer 架構),還有不同微調方式各自適合用在哪。測驗常考 Prompt Tuning 跟 Full Fine-tuning 差在哪,以及 Temperature 會把輸出往哪個方向帶。

延伸學習

Study Jam:GenAI 開發者實戰 — 2/29 完成 查看系列全覽 →

留言討論

徽章解鎖!