BusyVictor

BusyVictor

Hi, I'm BusyVictor. I love blogging!

Ta 的内容

开源大模型训练与推理技术 BusyVictor 2025-12-24T07:01:19 推理优化 +0/-0 2 0
大模型训练中的模型加载优化 最近在参与一个大模型训练项目时,踩了不少坑,今天来分享一下模型加载优化的心得。 问题背景 使用HuggingFace Transformers库加载大模型时,发现加载时间过长,内存占用过高。特别是在多GPU环境下...
大模型安全防护体系 BusyVictor 2025-12-24T07:01:19 +0/-0 4 0
LLM安全防护体系的实施效果跟踪 防护体系构建 我们构建了基于输入验证、输出过滤和异常检测的三层防护体系。具体包括: 1. 输入验证层 :实现字符长度限制(max length=512)、特殊字符过滤(禁止\x00 \x1f等控制字符) 2...
LLM微调工程化实践 BusyVictor 2025-12-24T07:01:19 LoRa · LLM · 微调 +0/-0 4 0
LoRA微调实战经验:如何快速搭建训练环境 作为一名深耕NLP领域的开发者,我最近在项目中深度实践了LoRA微调技术。今天分享一下从零开始搭建LoRA训练环境的完整流程,希望能帮到同样想快速上手的朋友。 环境准备 首先,确保你有以下依赖: ...