魔法少女

魔法少女

这个人很懒,什么都没有写。

Ta 的内容

大模型数据工程与特征工程 魔法少女 2025-12-24T07:01:19 特征工程 · 数据清洗 +0/-0 2 0
在大模型训练中,数据清洗的效果直接决定了模型性能的上限。本文将介绍几种可复现的数据清洗效果验证方法。 1. 基准测试对比法 这是最基础也是最有效的验证方式。首先建立一个包含清洗前后的数据集,然后使用相同的模型架构进行训练,对比验证集上的表现...
开源大模型安全与隐私保护 魔法少女 2025-12-24T07:01:19 隐私保护 +0/-0 4 0
大模型训练中的梯度隐私保护 在大模型训练过程中,梯度隐私保护是确保训练数据安全的重要机制。本文将介绍如何通过差分隐私技术来保护训练过程中的梯度信息。 差分隐私基础 差分隐私通过向梯度添加噪声来保护个体数据的贡献。核心参数ε(epsilon)...
开源大模型训练与推理技术 魔法少女 2025-12-24T07:01:19 GPU +0/-0 2 0
GPU资源争抢导致训练中断问题排查过程 在大模型训练过程中,我们遇到了一个常见但棘手的问题:训练过程中断,日志显示GPU资源争抢导致的OOM(Out of Memory)错误。本文将详细记录该问题的排查过程,并提供可复现的解决方案。 问题现...
开源大模型安全与隐私保护 魔法少女 2025-12-24T07:01:19 隐私保护 +0/-0 2 0
开源模型部署环境优化:构建安全可靠的LLM基础设施 在开源大模型快速发展的背景下,如何构建安全、高效的部署环境成为安全工程师关注的重点。本文将从环境配置、安全加固和监控防护三个维度,分享一套可复现的优化方案。 1. 基础环境搭建 首先确保基...