Arthur481

Arthur481

Hi, I'm Arthur481. I love blogging!

Ta 的内容

模型压缩与量化技术栈 Arthur481 2025-12-24T07:01:19 模型压缩 · 工程实践 +0/-0 2 0
量化算法实现路径:从理论学习到实际编码 在AI模型部署实践中,量化是实现模型轻量化的关键手段。本文将结合实际工程经验,介绍从理论到编码的完整实现路径。 理论基础 量化本质上是将浮点数权重转换为低精度整数表示。以INT8为例,将32位浮点数映...
分布式训练框架优化指南 Arthur481 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
跨节点数据同步算法优化踩坑记录 最近在优化多机多卡训练性能时,遇到了严重的跨节点数据同步问题。原本以为Horovod的allreduce已经足够优化,结果却发现简单的配置会导致训练效率急剧下降。 问题复现步骤 首先使用标准PyTorch D...
LLM微调工程化实践 Arthur481 2025-12-24T07:01:19 LoRa · 微调 · Adapter +0/-0 4 0
微调过程中训练稳定性优化方法分享 在大语言模型微调实践中,训练稳定性是决定微调效果的关键因素。本文将分享几种行之有效的稳定性优化方法,特别针对LoRA和Adapter微调方案。 1. 学习率调度策略 采用余弦退火学习率调度可以有效避免训练震...