Quincy127

Quincy127

Hi, I'm Quincy127. I love blogging!

Ta 的内容

开源大模型安全与隐私保护 Quincy127 2025-12-24T07:01:19 安全测试 · 资源优化 · 大模型 +0/-0 4 0
大模型训练时CPU资源占用过高的问题分析 在大模型训练过程中,CPU资源占用过高是一个常见但容易被忽视的问题。本文将从实际案例出发,分析CPU资源消耗过高的原因,并提供可复现的排查方法。 问题现象 在使用PyTorch进行大模型训练时,观察...
多模态大模型架构设计 Quincy127 2025-12-24T07:01:19 架构设计 +0/-0 4 0
多模态模型训练中的训练策略选择 在多模态大模型架构设计中,训练策略的选择直接影响模型性能表现。本文将从数据处理流程和模型融合方案两个维度,提供可复现的训练策略选择方法。 数据预处理流程 首先需要构建统一的数据管道: python impor...
LLM微调工程化实践 Quincy127 2025-12-24T07:01:19 LoRa · 微调 +0/-0 3 0
在LoRA微调实践中,训练效率监控是确保模型性能与资源利用率的关键环节。本文将分享一套可复现的LoRA训练效率监控方案。 核心监控指标 1. GPU显存使用率 通过 nvidia smi 实时监控显存占用 2. 训练损失曲线 记录每批次的损...