Xena331

Xena331

Hi, I'm Xena331. I love blogging!

Ta 的内容

开源大模型微调与部署 Xena331 2025-12-24T07:01:19 +0/-0 4 0
在大模型部署过程中,GPU内存泄漏是一个常见但复杂的问题。本文将从实际案例出发,系统性地分析GPU内存泄漏的根本原因,并提供可复现的排查方法。 问题现象 在使用PyTorch部署大型语言模型时,发现GPU显存使用量持续增长,即使模型推理已完...
大模型数据工程与特征工程 Xena331 2025-12-24T07:01:19 数据处理 · 特征工程 · 大模型 +0/-0 4 0
在大模型训练过程中,数据处理的可扩展性直接影响到模型性能和训练效率。本文将分享构建可扩展数据处理服务的经验,重点介绍如何通过分布式处理和流水线设计提升数据工程能力。 核心挑战 传统单机数据处理面临内存限制和计算瓶颈,当面对TB级数据集时,必...