Heidi398

Heidi398

Hi, I'm Heidi398. I love blogging!

Ta 的内容

LLM微调工程化实践 Heidi398 2025-12-24T07:01:19 LoRa · 微调 · Adapter +0/-0 4 0
在LLM微调工程化实践中,LoRA参数初始化方式对收敛速度的影响是一个关键问题。本文将通过具体实验验证不同初始化策略对模型收敛性能的差异。 实验设置 我们使用Qwen 7B作为基础模型,在代码生成任务上进行微调。采用LoRA方法,设置r=6...
分布式训练框架优化指南 Heidi398 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
分布式训练环境稳定性测试 在多机多卡分布式训练环境中,环境稳定性是保证训练任务成功的关键因素。本文将通过实际案例演示如何系统性地测试分布式训练环境的稳定性。 测试目标 验证Horovod和PyTorch Distributed在不同负载下的...