ColdFoot

ColdFoot

Hi, I'm ColdFoot. I love blogging!

Ta 的内容

大模型数据工程与特征工程 ColdFoot 2025-12-24T07:01:19 特征工程 · 大模型 +0/-0 3 0
在大模型训练中,领域知识的融合是提升特征提取质量的关键环节。本文将分享几种实用的领域知识融合方法,并提供可复现的实现步骤。 1. 基于规则的特征构造 通过领域专家提供的业务规则来构建新的特征变量。例如,在金融风控场景中,可以基于逾期天数、还...
大模型安全防护体系 ColdFoot 2025-12-24T07:01:19 数据完整性 +0/-0 3 0
大模型训练数据完整性保护措施 背景与挑战 大模型训练过程中,训练数据的完整性直接关系到模型的安全性和可靠性。攻击者可通过数据投毒、后门注入等手段篡改训练数据,导致模型行为异常。 核心防御策略 1. 数据哈希验证机制 python impor...
大模型安全防护体系 ColdFoot 2025-12-24T07:01:19 输入验证 +0/-0 2 0
大模型输入验证机制的部署实践 验证机制概述 针对大模型输入验证,我们采用多层过滤策略:首先通过正则表达式过滤恶意模式,其次利用字符级检测识别潜在攻击,最后实施请求频率限制防止批量攻击。 具体部署步骤 1. 正则表达式过滤 python im...
分布式训练框架优化指南 ColdFoot 2025-12-24T07:01:19 分布式训练 +0/-0 4 0
分布式训练中通信开销控制踩坑记录 最近在优化PyTorch Distributed训练时,被通信开销问题折磨得死去活来。分享一下踩坑心得。 问题现象 使用8卡训练时,实际训练时间比理论计算时间多出300%,明显是通信瓶颈。通过 torch....
模型监控与性能追踪系统 ColdFoot 2025-12-24T07:01:19 特征工程 · 模型监控 +0/-0 4 0
模型输入特征相关性变化监控踩坑记录 作为DevOps工程师,在构建ML模型监控平台时,我踩了一个关于特征相关性监控的坑。起初以为只要监控特征分布变化就够了,结果发现特征间相关性变化才是更关键的信号。 问题背景 我们部署了一个风控模型,通过监...
分布式大模型训练优化 ColdFoot 2025-12-24T07:01:19 正则化 · 分布式训练 +0/-0 2 0
在分布式大模型训练中,正则化参数的设置直接影响模型收敛速度和泛化性能。基于我们团队在多个大规模训练任务中的实践经验,分享一些可复现的调优方法。 L2正则化系数λ的设置策略 首先,建议从基础值开始测试:对于Adam优化器,通常初始设置为1e ...