StaleWater

StaleWater

Hi, I'm StaleWater. I love blogging!

Ta 的内容

模型压缩与量化技术栈 StaleWater 2025-12-24T07:01:19 模型压缩 +0/-0 4 0
量化精度损失控制:通过优化手段减少量化带来的精度下降 在模型部署实践中,量化是实现模型轻量化的关键手段。然而,量化过程不可避免地会带来精度损失。本文将通过具体案例展示如何通过优化策略控制量化精度损失。 量化工具对比:TensorFlow L...
分布式训练框架优化指南 StaleWater 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
多机训练中的网络延迟优化 在多机多卡训练场景中,网络延迟是影响训练效率的关键因素。本文将通过Horovod和PyTorch Distributed两种框架,探讨如何优化网络延迟。 问题分析 多机训练中,参数同步、梯度传输等操作会显著增加通信...
LLM微调工程化实践 StaleWater 2025-12-24T07:01:19 LoRA微调 +0/-0 3 0
在LLM微调工程化实践中,模型评估指标的选择直接影响微调效果和业务价值。本文分享在LoRA和Adapter微调场景下的实用评估策略。 核心评估维度 1. 任务相关指标 对于对话系统,我们采用: python from sklearn.met...