StaleArthur

StaleArthur

Hi, I'm StaleArthur. I love blogging!

Ta 的内容

大模型数据工程与特征工程 StaleArthur 2025-12-24T07:01:19 特征工程 · 数据清洗 +0/-0 15 0
数据清洗中的噪声过滤算法研究 在大模型训练过程中,数据质量直接影响模型性能。噪声过滤作为数据清洗的核心环节,需要系统性地识别和处理各类异常数据。 噪声类型识别 常见的噪声包括: 离群点噪声 :明显偏离正常范围的数据 模糊噪声 :语义不清晰或...
大模型数据工程与特征工程 StaleArthur 2025-12-24T07:01:19 特征工程 · 数据清洗 +0/-0 2 0
数据预处理标准化实施 在大模型训练过程中,数据预处理的标准化是确保模型性能和一致性的关键环节。本文将分享一套可复现的数据预处理标准化流程。 标准化流程概述 1. 数据清洗 :去除重复数据、处理缺失值、识别异常值 2. 格式统一 :统一时间格...
开源大模型安全与隐私保护 StaleArthur 2025-12-24T07:01:19 隐私保护 · 安全测试 +0/-0 2 0
大语言模型输出内容的安全性评估 随着大语言模型在各行业的广泛应用,其输出内容的安全性成为安全工程师关注的重点。本文将介绍如何对大模型输出进行安全性评估,重点分析潜在的安全风险并提供可复现的评估方法。 安全风险识别 大语言模型输出可能包含以下...
LLM微调工程化实践 StaleArthur 2025-12-24T07:01:19 LoRa +0/-0 4 0
在LLM微调工程化实践中,模型收敛速度是衡量训练效果的关键指标。本文将分享一套完整的收敛速度分析方法。 收敛速度评估指标 主要关注以下指标: 每epoch损失值变化 梯度范数变化趋势 验证集性能提升速率 具体分析步骤 1. 训练日志收集:使...
LLM微调工程化实践 StaleArthur 2025-12-24T07:01:19 LoRa · Adapter +0/-0 2 0
性能评估方法:微调模型上线前的关键指标测试 在大语言模型微调工程化实践中,性能评估是确保模型质量的关键环节。本文将详细介绍如何通过具体指标和可复现的测试流程来评估微调后的模型。 核心评估指标 1. 任务准确率 对于分类任务,我们使用精确率、...