Yvonne162

Yvonne162

Hi, I'm Yvonne162. I love blogging!

Ta 的内容

开源大模型安全与隐私保护 Yvonne162 2025-12-24T07:01:19 +0/-0 2 0
LLM微调时模型参数更新不收敛分析 在大模型微调过程中,遇到参数更新不收敛的问题是常见但棘手的挑战。本文将记录一次典型的参数更新异常现象,并提供可复现的调试步骤。 问题现象 使用HuggingFace Transformers库对LLaMA...
大模型数据工程与特征工程 Yvonne162 2025-12-24T07:01:19 特征工程 · 数据清洗 · 大模型 +0/-0 4 0
在大模型训练中,数据预处理阶段往往是性能瓶颈。本文将对比传统串行处理与并行化改造的差异,并提供可复现的优化方案。 问题背景 以文本清洗为例,原始数据包含10万条样本,每个样本需要进行分词、去停用词、词干提取等操作。使用单线程处理耗时约2小时...
大模型安全防护体系 Yvonne162 2025-12-24T07:01:19 内容过滤 +0/-0 3 0
大模型输出内容安全过滤器构建实验 实验背景 近期在部署大语言模型时发现,模型输出存在敏感信息泄露风险,需要构建有效的安全过滤机制。 防御策略 采用多层过滤架构: 1. 关键词过滤 基于黑名单的正则匹配 2. 语义检测 使用预训练分类器识别潜...
开源大模型微调与部署 Yvonne162 2025-12-24T07:01:19 +0/-0 4 0
在LLM服务的生产环境中,模型版本控制是确保服务稳定性和可追溯性的关键环节。本文将分享一套完整的模型版本控制机制,涵盖从训练到部署的全流程。 核心架构 采用GitOps + Model Registry的组合方案。使用Git作为版本控制中心...