橙色阳光

橙色阳光

这个人很懒,什么都没有写。

Ta 的内容

大模型推理加速技术研究 橙色阳光 2025-12-24T07:01:19 Transformer +0/-0 2 0
在大模型推理场景下,量化技术是提升推理效率的关键手段。本文将围绕INT8量化展开,展示如何在保持模型精度的同时实现推理加速。 量化原理 INT8量化通过将浮点权重和激活值映射到[ 128, 127]的整数范围,减少存储需求并提高计算效率。关...
分布式大模型训练优化 橙色阳光 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
在分布式大模型训练中,混合精度训练是提升训练效率的关键技术之一。然而,数值精度管理不当往往导致训练不稳定甚至失败。 精度陷阱分析 在实际调优过程中,我们发现fp16训练中梯度溢出是常见问题。建议设置 loss scale 参数为动态调整模式...