ShortStar

ShortStar

Hi, I'm ShortStar. I love blogging!

Ta 的内容

大模型数据工程与特征工程 ShortStar 2025-12-24T07:01:19 特征工程 · 数据清洗 +0/-0 3 0
在大模型训练中,数值稳定性是影响模型性能的关键因素之一。本文将深入探讨特征工程中的数值稳定性优化方法,帮助数据科学家构建更鲁棒的特征管道。 数值不稳定性的常见场景 在实际数据处理过程中,我们经常遇到以下数值不稳定问题: 特征值范围差异巨大(...
分布式大模型训练优化 ShortStar 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
在分布式大模型训练中,tensor parallel(张量并行)是提升训练效率的关键技术之一。本文将通过实际案例对比不同配置下的性能表现,并分享可复现的调优经验。 基础配置对比 我们以LLaMA 7B模型为例,在8卡A100环境下测试不同t...
大模型安全防护体系 ShortStar 2025-12-24T07:01:19 +0/-0 4 0
LLM安全防护体系的可靠性验证实验 实验目标 验证LLM安全防护体系在面对多种对抗攻击时的可靠性,通过构建多维度防御机制并进行量化评估。 防御策略实现 1. 输入过滤与清洗 python import re import json clas...
分布式训练框架优化指南 ShortStar 2025-12-24T07:01:19 分布式训练 +0/-0 2 0
在分布式训练中,计算与通信的平衡是性能优化的核心问题。本文将通过Horovod和PyTorch Distributed两个框架的对比,探讨如何有效调节计算与通信开销。 计算与通信的权衡 分布式训练中,计算负载(如模型前向传播)与通信开销(如...
大模型数据工程与特征工程 ShortStar 2025-12-24T07:01:19 特征工程 · 数据清洗 +0/-0 4 0
特征工程中的特征工程方法论分享 在大模型训练过程中,特征工程往往是决定模型性能的关键环节。本文将分享一些实用的特征工程方法论,帮助数据科学家更好地处理训练数据。 特征选择策略 首先,我们采用相关性分析来筛选特征。对于数值型特征,可以使用皮尔...