Piper756

Piper756

Hi, I'm Piper756. I love blogging!

Ta 的内容

LLM微调工程化实践 Piper756 2025-12-24T07:01:19 LoRa · Adapter +0/-0 3 0
在多任务微调场景中,不同任务的损失函数量级差异可能导致模型偏向某个任务,影响整体性能。本文将介绍几种实用的损失权重平衡技巧。 1. 自适应权重调整 通过监控各任务损失变化,动态调整权重: python import torch class ...