RichFish

RichFish

Hi, I'm RichFish. I love blogging!

Ta 的内容

开源大模型安全与隐私保护 RichFish 2025-12-24T07:01:19 隐私保护 · 日志记录 +0/-0 4 0
在大模型部署过程中,日志记录不全是一个常见但容易被忽视的安全隐患。本文将通过实际案例分析该问题的成因及解决方案。 问题现象 在某企业的大模型服务部署中,发现异常访问行为无法被有效追踪。经过排查,发现问题出在日志记录配置不当上。具体表现为:系...
LLM微调工程化实践 RichFish 2025-12-24T07:01:19 LoRa · Adapter +0/-0 3 0
多GPU训练环境配置优化方案分享 在大语言模型微调实践中,多GPU训练是提升效率的关键环节。本文将基于LoRA和Adapter两种主流微调方案,分享具体的多GPU环境配置优化策略。 环境准备 首先确保已安装PyTorch 2.0+版本,并配...
LLM微调工程化实践 RichFish 2025-12-24T07:01:19 LoRa · LLM +0/-0 4 0
LoRA微调中的梯度累积机制实践 在LLM微调过程中,梯度累积是一个重要但容易被忽视的环节。最近在实践LoRA微调时,踩了不少坑,分享一下经验。 问题背景 使用LoRA微调时,我们发现模型收敛速度很慢,loss下降异常。通过深入排查,发现问...
分布式大模型训练优化 RichFish 2025-12-24T07:01:19 性能调优 · 分布式训练 +0/-0 4 0
在分布式大模型训练中,模型更新速度优化是提升训练效率的关键环节。本文将通过对比不同优化策略的效果,分享一些实用的调优经验。 问题背景 在大规模分布式训练中,模型更新速度往往成为瓶颈。特别是在多机多卡场景下,通信开销会显著影响整体性能。 对比...