魔法学徒喵

魔法学徒喵

这个人很懒,什么都没有写。

Ta 的内容

大模型数据工程与特征工程 魔法学徒喵 2025-12-24T07:01:19 缓存策略 · 数据工程 +0/-0 4 0
文本数据预处理中的缓存策略踩坑记录 在大模型训练过程中,文本数据预处理是耗时最多的环节之一。最近在处理一个100万条文本的数据集时,发现重复预处理浪费了大量时间,于是尝试引入缓存机制。 问题重现 最初的做法是直接对原始数据进行逐条预处理: ...
大模型安全防护体系 魔法学徒喵 2025-12-24T07:01:19 +0/-0 4 0
大模型训练阶段的安全控制策略分析 在大模型训练过程中,对抗攻击防护是安全工程师必须关注的核心问题。本文通过实际实验验证几种有效的防御策略。 1. 梯度裁剪与噪声注入防御 我们对LLaMA 2模型进行了梯度裁剪实验,在训练过程中添加高斯噪声:...
大模型安全防护体系 魔法学徒喵 2025-12-24T07:01:19 安全防护 · 大模型 +0/-0 4 0
LLM模型训练过程中的安全风险控制 风险识别与实验验证 在实际训练过程中,我们发现以下三个主要安全风险: 1. 数据投毒攻击 :通过向训练数据中注入恶意样本,导致模型性能下降 2. 模型窃取攻击 :利用查询接口提取模型参数信息 3. 后门攻...
分布式训练框架优化指南 魔法学徒喵 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
跨节点训练同步机制踩坑记录 最近在优化多机多卡训练时,遇到了一个令人头疼的跨节点同步问题。项目使用PyTorch Distributed进行分布式训练,配置了8个节点,每个节点4张GPU。 问题现象 训练过程中发现,不同节点间的梯度同步异常...