top of page

22 - 超參數調校攻略 —— 「養熊貓」定「釣魚子」?


1️⃣ 乜嘢係超參數?


  • 模型內嘅值(權重、偏差)可以自動學;

  • 模型外嘅規則(learning rate、層數、batch size…)要你人手定。

呢啲人手設定就叫 超參數 (Hyper-parameters)。好似煲湯:

  • 排骨、紅棗 = 網絡結構;

  • 火力、鹽量、水份 = 超參數。


    材料啱唔代表湯靚,火候錯一樣會「又柴又淡」。


2️⃣ 兩大調參流派


🐼 熊貓式(Panda Strategy)——慢慢養,日日睇


適合:

  • 一機一 GPU、學生黨、Side-project

  • 想透徹觀察模型行為

操作:

  1. 隨機揀一組超參數開始訓練

  2. 跑 2-3 個 epoch / 幾千 step

  3. 睇 Loss、Accuracy、Gradient 分佈

  4. 第二日改 learning rate、dropout、λ …

  5. Loop 返 Step 2

真實比喻: