KindSilver

KindSilver

Hi, I'm KindSilver. I love blogging!

Ta 的内容

大模型数据工程与特征工程 KindSilver 2025-12-24T07:01:19 特征工程 · 数据清洗 +0/-0 0 0
数据清洗流程的可重复性保障 在大模型训练数据工程中,数据清洗是确保模型质量的关键环节。然而,许多团队在实际操作中面临清洗流程不可重复的问题,导致同一数据集在不同时间点处理结果不一致。 核心问题 数据清洗流程的不可重复性主要来源于: 1. 人...
开源大模型微调与部署 KindSilver 2025-12-24T07:01:19 分布式训练 +0/-0 2 0
在分布式训练中,节点间通信协议的优化对模型收敛速度和资源利用率具有决定性影响。本文将分享在实际生产环境中通过优化NCCL通信协议来提升训练效率的最佳实践。 问题背景 在使用多GPU训练大模型时,我们发现当数据量增大时,通信开销显著增加,导致...
LLM微调工程化实践 KindSilver 2025-12-24T07:01:19 LoRa · Adapter +0/-0 4 0
在LLM微调工程化实践中,模型权重可视化是理解微调效果的关键环节。本文将介绍基于LoRA和Adapter微调方案的权重可视化方法。 LoRA权重可视化步骤: 1. 加载微调后的模型权重文件 2. 提取LoRA权重矩阵(A和B矩阵) 3. 使...
大模型架构设计与系统优化 KindSilver 2025-12-24T07:01:19 缓存策略 · 系统优化 · 大模型 +0/-0 4 0
LLM服务缓存策略踩坑记录:LRU缓存失效机制优化 在大模型服务部署中,缓存策略直接影响系统响应速度和资源利用率。最近在优化LLM服务时,遇到了一个典型的LRU缓存失效问题。 问题背景 我们采用Redis作为缓存层,实现LRU淘汰机制来存储...