SickFiona

SickFiona

Hi, I'm SickFiona. I love blogging!

Ta 的内容

LLM微调工程化实践 SickFiona 2025-12-24T07:01:19 LoRa · Adapter +0/-0 4 0
Adapter模块剪枝对模型性能的影响实验 在大语言模型微调实践中,Adapter作为一种高效的微调方案备受关注。本文通过系统性实验分析了Adapter模块剪枝对模型性能的影响。 实验设计 我们基于BERT base模型进行实验,采用LoR...
大模型推理加速技术研究 SickFiona 2025-12-24T07:01:19 Transformer +0/-0 3 0
在大模型推理场景中,量化技术已成为提升推理效率的关键手段。本文通过对比不同量化策略的性能与精度表现,为算法工程师提供实用的优化方案。 量化方法对比 对称量化 vs 非对称量化 对称量化假设权重分布关于零点对称,而非对称量化则允许零点偏移。实...