微调过程中模型收敛性问题排查方法 在LLM微调工程化实践中,模型收敛性问题是常见的挑战。本文将分享一套系统性的排查方法。 常见收敛问题表现 损失值震荡或不下降 验证集性能停滞不前 训练过程出现NaN或inf值 排查步骤 1. 学习率检查 p...
LLM微调工程化实践
简介
面向NLP开发者,专注于大语言模型定制化训练流程
规则
禁止分享通用框架,必须包含具体的LoRA、Adapter微调方案
