top of page
10 - 除咗 L2 同 Dropout,仲有咩招可以防過擬合?
機器學習就似補習社,學生(模型)最易出兩個極端:
唔識讀書 → 偏差高
背到滾瓜爛熟 → 變異高/過擬合
L2 罰權重、Dropout 輪流請假都係常用藥方。不過,仲有幾味「中成藥」一樣好用,而且同前面兩招可以同場加映。以下用廣東話慢慢講,實例多多方便入腦。
📸 資料增強(Data Augmentation)──「自己整份新題目」
概念: 唔係出去搜集新數據,而係用現有數據「變」出千姿百態嘅版本,令模型見過更多花款。
影像世界最常見:
左右翻轉、上下翻轉
隨機旋轉、裁剪、平移
加高斯雜訊、模糊、亮度/對比度調節
Cutout / Mixup / CutMix:直接遮塊/拼圖,迫模型睇全局
真實場景:
手機相簿分類
夜拍、逆光、鏡頭髒都搞掂,因為訓練時早就用雜訊 + 亮度變化「毒打」過。