top of page
22 - 超參數調校攻略 —— 「養熊貓」定「釣魚子」?
1️⃣ 乜嘢係超參數?
模型內嘅值(權重、偏差)可以自動學;
模型外嘅規則(learning rate、層數、batch size…)要你人手定。
呢啲人手設定就叫 超參數 (Hyper-parameters)。好似煲湯:
排骨、紅棗 = 網絡結構;
火力、鹽量、水份 = 超參數。
材料啱唔代表湯靚,火候錯一樣會「又柴又淡」。
2️⃣ 兩大調參流派
🐼 熊貓式(Panda Strategy)——慢慢養,日日睇
適合:
一機一 GPU、學生黨、Side-project
想透徹觀察模型行為
操作:
隨機揀一組超參數開始訓練
跑 2-3 個 epoch / 幾千 step
睇 Loss、Accuracy、Gradient 分佈
第二日改 learning rate、dropout、λ …
Loop 返 Step 2
真實比喻:
養盆栽——朝早睇葉尖乾唔乾再加水。
手沖咖啡——試一杯後微調磨豆粗幼。
寫 call 鱷魚籌碼——細注慢試先知水溫。
優點:
成本低,Laptop 都搞得掂
每一步你知發生咩事,學到經驗
缺點:
耗時,可能要煲足幾日先有像樣結果
同時間只睇到一條路線,容易 miss optimal
🐟 魚子醬式(Caviar Strategy)——一次撒網,孵幾百粒
適合:
多卡 GPU、雲平台、科研團隊
KPI 緊迫,想快啲搵最佳組合
操作:
用 Random / Bayesian / Evolution 方法產生 50-500 組超參數
分配去多台機同時開訓練
設置 Early-stopping,爛 model 十分鐘就砍
訓練完統計排行榜,揀 Top-k 再細調或 ensemble
真實比喻:

