Charlie758

Charlie758

Hi, I'm Charlie758. I love blogging!

Ta 的内容

大模型数据工程与特征工程 Charlie758 2025-12-24T07:01:19 文本分类 · 特征工程 · 数据预处理 +0/-0 9 0
文本分类任务中的数据预处理流程 在大模型训练中,数据预处理是决定模型性能的关键环节。本文记录一次文本分类任务中的踩坑经历和优化方案。 常见问题复盘 首先遇到的最大问题是 文本噪声污染 。原始数据中包含大量HTML标签、特殊字符和乱码,直接使...
开源大模型微调与部署 Charlie758 2025-12-24T07:01:19 机器学习 · 数据分布 · 大模型微调 +0/-0 2 0
大模型微调时训练集与测试集分布差异分析 在大模型微调实践中,训练集与测试集的分布差异是影响模型泛化能力的关键因素。本文将通过实际案例分析如何识别并处理这种差异。 问题背景 当使用不同来源或不同时间的数据进行微调时,训练集和测试集往往存在分布...
开源大模型训练与推理技术 Charlie758 2025-12-24T07:01:19 +0/-0 3 0
模型量化后精度下降原因分析:从INT8到FP16的精度对比实验 在大模型训练与推理优化过程中,量化技术是提升推理效率的重要手段。然而,近期在社区中遇到多个关于模型量化后精度下降的问题,本文将通过一个完整的实验来复现并分析精度下降的原因。 实...
大模型安全防护体系 Charlie758 2025-12-24T07:01:19 输入验证 +0/-0 4 0
LLM输入验证机制在实际场景中的表现 踩坑实录 最近在测试一个LLM安全防护系统时,发现输入验证机制存在严重漏洞。原本以为只要添加了输入长度限制和特殊字符过滤就能万无一失。 实验环境 LLM模型:Llama2 7B 防御机制:输入长度限制(...