Gemini 輔助數據分析
GCP
課程概述
Gemini 正在改變資料科學家與分析師每天的工作方式。BigQuery 和 Looker 都內建了 Gemini 輔助功能,你可以用自然語言寫出 SQL 查詢、拿到資料洞察建議,還能自動產生視覺化圖表。這門課就帶你實際感受一下,Gemini 怎麼把「資料到洞察」這段路走得更快。
你將學到
- 在 BigQuery 中使用 Gemini 的自然語言轉 SQL 功能
- 利用 Gemini 進行資料探索與異常值偵測
- 在 Looker 中使用 Gemini 自動生成儀表板
- 理解 Gemini 輔助分析的限制與最佳實踐
- 結合 Gemini 建議與人工判斷的混合工作流
核心概念
Gemini 在資料分析中的角色
Gemini 不是要取代資料分析師,比較像是坐在你旁邊的「AI 副駕」,主要在三個地方幫上忙:
- 加速 — 自動幫你寫 SQL、公式和查詢,省下手動敲的時間
- 探索 — 找出你可能漏看的資料模式和異常值
- 解釋 — 把複雜的查詢結果整理成看得懂的白話摘要
BigQuery 中的 Gemini 功能
在 BigQuery Console 中,Gemini 提供以下輔助功能:
- 自然語言轉 SQL — 輸入「顯示上個月各地區的銷售總額」,Gemini 自動產生
SELECT region, SUM(amount) FROM sales WHERE date >= ... GROUP BY region - SQL 解釋 — 選取一段複雜的 SQL,Gemini 用自然語言解釋它做了什麼
- SQL 自動完成 — 根據表結構和查詢上下文,智慧預測下一段 SQL
- 欄位建議 — 分析資料表結構,建議可能有用的 JOIN 和聚合
Looker 中的 Gemini 功能
Looker 接上 Gemini 之後,就算不是技術背景的人,也能做出夠專業的資料視覺化:
- 自然語言查詢 — 在 Looker 搜尋列輸入問題,自動生成對應的 Explore 查詢
- 儀表板摘要 — 自動為儀表板上的圖表產生文字摘要與重點發現
- 異常偵測 — 主動標示數值異常的資料點,並提供可能的原因
Gemini 建議的品質控管
Gemini 寫出來的 SQL 和分析不見得每次都對。所以最好養成「相信,但要驗證」的習慣:
| 動作 | 做法 |
|---|---|
| 驗證 SQL 語法 | 先用 LIMIT 10 預覽結果再執行全量查詢 |
| 確認業務邏輯 | 比對 Gemini 的 JOIN 條件與實際資料關聯 |
| 交叉驗證數字 | 用已知的報表數字驗證 Gemini 產生的彙總結果 |
| 審核篩選條件 | 確認 WHERE 子句沒有遺漏重要的過濾條件 |
實作重點
- 在 BigQuery Console 中點擊查詢編輯器上方的「Gemini」圖示即可啟用輔助功能
- 自然語言轉 SQL 準不準,很看表結構描述得清不清楚,欄位名稱越好懂,效果就越好
- Looker 的 Gemini 功能需要管理員在 Looker 設定中啟用 Gemini integration
- 常見錯誤:直接信任 Gemini 產生的複雜 JOIN 查詢而未驗證,導致資料重複或遺漏
- 最佳實踐:幫 BigQuery 表加上欄位描述(Column Description),Gemini 會讀這些元資料,寫出來的 SQL 會更準
Skill Badge 指引
Lab 連結:Gemini for Data Scientists and Analysts — 完成此 lab 可獲得 Skill Badge
延伸學習
- 在 BigQuery 中使用 Gemini 模型 — 在 SQL 查詢中直接呼叫 Gemini 模型
- Gemini 提升 BigQuery 生產力 — 更多 Gemini 在 BigQuery 中的生產力技巧
- BigQuery ML 建模實戰 — 在 BigQuery 中建立 ML 模型的完整流程
Study Jam:數據與 AI 基礎 — 9/12 完成
查看系列全覽 →