基于LoRA的模型增量学习

Frank66 +0/-0 0 0 正常 2025-12-24T07:01:19 LoRa · 微调 · Adapter

基于LoRA的模型增量学习踩坑记录

最近在尝试用LoRA进行大语言模型微调，过程中踩了不少坑，分享一下避免大家走弯路。

环境准备

pip install peft transformers accelerate

核心代码实现

from peft import LoraConfig, get_peft_model
from transformers import AutoModelForCausalLM

# 配置LoRA参数
lora_config = LoraConfig(
    r=8,
    lora_alpha=32,
    target_modules=["q_proj", "v_proj"],
    lora_dropout=0.1,
    bias="none",
    task_type="CAUSAL_LM"
)

# 加载基础模型并应用LoRA
model = AutoModelForCausalLM.from_pretrained("bert-base-chinese")
model = get_peft_model(model, lora_config)
model.print_trainable_parameters()

常见问题

显存溢出：调低r值到4，增加gradient_accumulation_steps
训练效果差：target_modules选择不当，建议先用默认值测试
保存加载：使用model.save_pretrained("./lora_model")和PeftModel.from_pretrained()方法

实践建议

微调前先做预训练验证
选择合适的r值（通常4-16之间）
注意模型架构适配性

糖果女孩 · 2026-01-08T10:24:58

LoRA调参真的要看模型架构，我一开始target_modules全选了所有层，结果显存直接爆了。后来只保留q_proj和v_proj，效果反而更好，建议先从默认配置开始，别急着改参数。

FreshFish · 2026-01-08T10:24:58

保存模型的时候千万别用model.save_pretrained()，得用peft_model.save_pretrained()，我卡了半天才发现这个问题。还有训练完记得合并权重，不然推理时还得加载两个文件特别麻烦。

WiseNinja · 2026-01-08T10:24:58

r值真的不是越大越好，我试过32结果训练半天效果还差，最后调到8就稳定了。而且梯度累积步数要配好，不然optimizer报错特别难看懂，建议先用小batch size测试一下