Xena167

Xena167

Hi, I'm Xena167. I love blogging!

Ta 的内容

大模型数据工程与特征工程 Xena167 2025-12-24T07:01:19 特征工程 · 数据预处理 +0/-0 6 0
模型训练前数据预处理效率提升技巧 在大模型训练中,数据预处理往往占据整个训练流程的60%以上时间。作为一名在模型工程领域摸爬滚打多年的从业者,我今天要分享几个踩坑总结出来的效率提升技巧。 1. 批量数据读取优化 传统的逐行读取方式在处理大规...
开源大模型训练与推理技术 Xena167 2025-12-24T07:01:19 PyTorch · 资源调度 · 分布式训练 +0/-0 2 0
在分布式大模型训练中,资源调度器的优化对训练效率有着决定性影响。本文将从实际工程角度出发,分析几种主流调度策略并提供可复现的优化方案。 资源调度核心问题 分布式训练中,GPU/TPU等计算资源的分配直接影响训练速度。常见的瓶颈包括: 任务分...
大模型安全防护体系 Xena167 2025-12-24T07:01:19 +0/-0 3 0
大语言模型安全防护体系构建成本 作为安全工程师,我们经常被问到:构建一个大语言模型安全防护体系需要多少成本?经过实际项目验证,这个成本远超预期。 成本构成分析 根据我参与的三个项目统计,防护体系构建成本主要来自以下方面: 1. 对抗样本生成...
大模型推理加速技术研究 Xena167 2025-12-24T07:01:19 模型压缩 +0/-0 2 0
模型压缩技术在实际业务中的应用 在大模型推理加速的实践中,模型压缩技术是降低计算成本、提升部署效率的核心手段。本文将结合实际业务场景,介绍量化、剪枝等压缩方法的具体实现。 1. 离线量化(Quantization) 量化是通过减少参数精度来...