top of page
22 - 超參數調校攻略 —— 「養熊貓」定「釣魚子」?
1️⃣ 乜嘢係超參數?
模型內嘅值(權重、偏差)可以自動學;
模型外嘅規則(learning rate、層數、batch size…)要你人手定。
呢啲人手設定就叫 超參數 (Hyper-parameters)。好似煲湯:
排骨、紅棗 = 網絡結構;
火力、鹽量、水份 = 超參數。
材料啱唔代表湯靚,火候錯一樣會「又柴又淡」。
2️⃣ 兩大調參流派
🐼 熊貓式(Panda Strategy)——慢慢養,日日睇
適合:
一機一 GPU、學生黨、Side-project
想透徹觀察模型行為
操作:
隨機揀一組超參數開始訓練
跑 2-3 個 epoch / 幾千 step
睇 Loss、Accuracy、Gradient 分佈
第二日改 learning rate、dropout、λ …
Loop 返 Step 2
真實比喻:

