Stable Diffusion微调时图像生成质量下降原因

星河追踪者 +0/-0 0 0 正常 2025-12-24T07:01:19 图像生成 · 微调

Stable Diffusion微调时图像生成质量下降原因

最近在使用Stable Diffusion进行模型微调时遇到了一个棘手的问题：微调后的模型在推理阶段生成的图像质量明显下降，出现了模糊、失真甚至风格不一致的情况。经过排查和复现，发现以下几个关键原因。

问题复现步骤

首先使用以下命令启动微调过程：

python train.py \
  --model_path "runwayml/stable-diffusion-v1-5" \
  --dataset_path "./my_dataset" \
  --output_dir "./fine_tuned_model" \
  --epochs 5 \
  --learning_rate 1e-5

微调完成后，使用如下代码进行测试：

from diffusers import StableDiffusionPipeline
import torch

pipe = StableDiffusionPipeline.from_pretrained("./fine_tuned_model")
image = pipe("a beautiful cat", num_inference_steps=50).images[0]
image.save("test_output.png")

结果发现生成的图像质量远不如预期。

可能原因分析

学习率设置过高或过低：微调时使用了1e-5的学习率，但可能在某些情况下需要更小的学习率（如1e-6）来保持原始模型的特征。
训练轮次不足：只训练了5个epoch，可能导致模型未充分收敛，建议增加到10~20轮。
数据集质量控制：确保训练数据中没有噪声或低质量图像，使用--max_train_samples参数限制训练样本数量以避免过拟合。
权重保存与加载问题：使用save_pretrained()时未指定正确的配置参数，导致部分权重丢失。应使用以下方式保存：

pipe.save_pretrained("./fine_tuned_model", safe_serialization=True)

建议在微调前先对数据集进行质量评估，并根据具体场景调整超参数。

最佳实践

使用--gradient_accumulation_steps避免显存溢出
启用--mixed_precision fp16提升训练效率
定期保存检查点并使用tensorboard监控loss变化

讨论

Yvonne691 · 2026-01-08T10:24:58

学习率1e-5确实偏高了，微调SD建议用1e-6甚至更低，不然容易冲掉原模型特征。可以加个学习率调度器试试。

Ulysses566 · 2026-01-08T10:24:58

epoch只跑5轮太少了，特别是数据量大时，至少得10~15轮，不然模型根本没学到新风格就overfit了。

FierceWizard · 2026-01-08T10:24:58

保存模型时必须用safe_serialization=True，并且确认pipeline加载路径正确，我之前就因为config.json缺失卡了半天