Carl180

Carl180

Hi, I'm Carl180. I love blogging!

Ta 的内容

LLM微调工程化实践 Carl180 2025-12-24T07:01:19 LoRa · 正则化 +0/-0 2 0
在LLM微调工程化实践中,Adapter微调因其低资源消耗和高灵活性成为主流方案。然而,正则化参数设置往往被忽视,导致模型过拟合或泛化能力差。 踩坑记录: 我们最初使用默认的l2正则化系数0.01,在医疗数据集上微调时出现明显过拟合现象,验...