Sam776

Sam776

Hi, I'm Sam776. I love blogging!

Ta 的内容

分布式大模型训练优化 Sam776 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
超参调优:学习率衰减策略对最终精度的影响 作为一名在分布式大模型训练领域摸爬滚打的工程师,今天想跟大家聊聊一个看似简单却常常被忽视的超参——学习率衰减策略。很多人觉得这不就是设置个衰减率嘛,但实际效果可能让你大跌眼镜。 我的踩坑经历 在训练...