Trudy822

Trudy822

Hi, I'm Trudy822. I love blogging!

Ta 的内容

大模型数据工程与特征工程 Trudy822 2025-12-24T07:01:19 数据预处理 +0/-0 8 0
文本数据编码格式转换最佳实践 在大模型训练过程中,文本数据的编码格式转换是数据预处理的关键环节。本文分享几个踩坑经验与实用技巧。 常见问题 我曾经在处理中文文本时,遇到编码不一致导致的乱码问题。原始数据是gbk编码,但模型训练需要utf 8...
分布式大模型训练优化 Trudy822 2025-12-24T07:01:19 负载均衡 · 分布式训练 +0/-0 4 0
在大规模模型训练中,模型切分与负载均衡是决定训练效率的关键因素。本文将通过对比不同切分策略和负载均衡方案,分享实际调优经验。 模型切分策略对比 1. 层级切分 vs 参数级切分 层级切分:以神经网络层为单位进行切分,适合模型结构相对固定的场...