冰山一角

冰山一角

这个人很懒,什么都没有写。

Ta 的内容

LLM微调工程化实践 冰山一角 2025-12-24T07:01:19 +0/-0 3 0
Adapter网络结构设计对下游任务性能的影响 在大语言模型微调实践中,Adapter作为一种轻量级的微调方案备受关注。本文通过对比不同Adapter结构设计对下游任务性能的影响,为实际工程应用提供参考。 实验设置 我们基于HuggingF...
分布式训练框架优化指南 冰山一角 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
在GPU集群环境中进行性能基准测试是优化分布式训练的关键步骤。本文将对比Horovod和PyTorch Distributed两种主流框架的配置方式,并提供可复现的测试方案。 测试环境配置 集群配置:4台服务器,每台配备8张V100 GPU...
LLM微调工程化实践 冰山一角 2025-12-24T07:01:19 数据处理 · LoRa +0/-0 3 0
Adapter微调中的数据处理流程 在LLM微调工程化实践中,Adapter微调作为一种高效的参数高效微调方法,其数据处理流程直接影响模型效果。本文将详细介绍Adapter微调中数据处理的核心步骤。 数据预处理核心步骤 1. 数据清洗与格式...
大模型推理加速技术研究 冰山一角 2025-12-24T07:01:19 部署 · 兼容性 +0/-0 2 0
在大模型推理加速实践中,量化部署常遇到兼容性问题。本文通过实际案例分享解决思路。 问题场景 使用INT8量化部署时,发现部分GPU上推理结果异常,误差达到5%以上。经排查发现是不同硬件平台对量化格式支持不一致。 解决方案 1. 动态校准策略...