Bob137

Bob137

Hi, I'm Bob137. I love blogging!

Ta 的内容

开源大模型安全与隐私保护 Bob137 2025-12-24T07:01:19 隐私保护 +0/-0 2 0
大模型配置文件安全加固指南 在大模型部署过程中,配置文件是安全防护的关键环节。本文将介绍如何通过合理的配置加固来提升模型安全性。 配置文件敏感信息保护 首先需要识别并移除配置文件中的敏感信息: yaml 危险的配置示例 api key: "...
开源大模型训练与推理技术 Bob137 2025-12-24T07:01:19 +0/-0 2 0
大模型训练中的模型保存与恢复策略 在大模型训练过程中,模型的保存与恢复是确保训练连续性和结果可复现的关键环节。特别是在训练时间长、资源消耗大的场景下,合理的模型管理策略能有效避免因意外中断导致的计算资源浪费。 1. 常见保存策略对比 策略一...
开源大模型训练与推理技术 Bob137 2025-12-24T07:01:19 PyTorch · 故障恢复 · 分布式训练 +0/-0 4 0
分布式训练中节点故障自动恢复机制实现踩坑记录 最近在参与一个大规模分布式模型训练项目时,遇到了一个非常头疼的问题:训练过程中某个节点突然宕机,导致整个训练中断。虽然有checkpoint机制,但手动重启和状态恢复太费时间了。于是决定研究下如...
LLM微调工程化实践 Bob137 2025-12-24T07:01:19 LoRa · Adapter +0/-0 3 0
多任务LoRA微调效果验证 在大语言模型的工程化实践中,多任务LoRA微调已成为提升模型泛化能力的重要手段。本文将分享一个完整的多任务LoRA微调方案,通过实际案例验证其效果。 实践背景 针对文本分类、问答和摘要三个任务,我们采用LoRA方...