用户主页 - 极简博客

React Router v6升级实践 Yvonne691 2025-12-24T07:01:19 React Router +0/-0 5 0

v6版本升级后路由组件卸载异常的排查记录在将项目从React Router v5升级到v6的过程中，我们遇到了一个令人困惑的问题：路由组件在切换时出现了异常的卸载行为。本文将详细记录这个问题的排查过程。问题现象升级后，当用户在不同路由...

Linux内核与系统安全 Yvonne691 2025-12-24T07:01:19 性能优化 · 安全配置 · 内核参数 +0/-0 2 0

作为一名系统管理员，在日常运维中经常遇到性能瓶颈和安全风险并存的情况。今天分享几个实际踩坑经验，帮助大家通过内核参数调优来提升系统性能与安全性。 1. TCP连接优化避免连接队列溢出在高并发场景下，我们曾遇到大量TIME WAIT连接导...

开源大模型微服务治理 Yvonne691 2025-12-24T07:01:19 微服务 · 安全防护 · 大模型 +0/-0 2 0

大模型服务安全防护体系构建踩坑记录最近在为公司大模型微服务架构搭建安全防护体系，踩了不少坑，记录一下。问题背景我们的大模型服务采用微服务架构部署，面临API滥用、数据泄露等风险。按照社区要求，需要建立完整的安全防护体系。核心防护措施...

大模型架构设计与系统优化 Yvonne691 2025-12-24T07:01:19 大模型 · 推理优化 +0/-0 4 0

基于量化压缩的大模型推理优化技术在大模型推理场景中，计算资源和内存开销是制约性能的关键因素。本文将分享一种基于量化压缩的优化方案，通过实际部署经验总结出可复现的技术路径。量化原理与实践量化压缩主要通过降低模型参数精度来减少存储空间和计...

分布式大模型训练优化 Yvonne691 2025-12-24T07:01:19 分布式训练 +0/-0 2 0

在分布式大模型训练中，批处理大小（batch size）对训练速度的影响往往被低估。本文通过对比实验，深入分析了不同batch size设置对训练性能的具体影响。实验环境模型：BERT base 数据集：Wikipedia 2023 硬...

开源大模型微调与部署 Yvonne691 2025-12-24T07:01:19 死锁排查 · 分布式训练 · 大模型微调 +0/-0 3 0

大模型训练时出现死锁问题的排查思路在大模型微调过程中，死锁是常见的生产环境问题。本文将结合实际案例，分享排查思路和解决方案。常见死锁场景 1. 分布式训练中的通信死锁：多GPU间梯度同步阻塞 2. 数据加载死锁：DataLoader...

开源大模型微调与部署 Yvonne691 2025-12-24T07:01:19 大模型微调 +0/-0 4 0

在开源大模型微调过程中，显存管理是决定训练能否顺利进行的关键因素。本文将分享几个实用的显存优化技巧，帮助ML工程师在有限硬件资源下高效完成模型微调。 1. 梯度检查点（Gradient Checkpointing）这是最有效的显存节省方法...

LLM微调工程化实践 Yvonne691 2025-12-24T07:01:19 多任务学习 · LoRa · Adapter +0/-0 2 0

多任务学习中损失权重设置踩坑记录在大语言模型的多任务微调实践中，我们遇到了一个典型的损失权重设置问题。以LoRA微调为例，在同时训练多个下游任务时，不同任务的损失值差异巨大，导致模型倾向于优先优化损失较大的任务。问题复现步骤： 1. 准...

LLM微调工程化实践 Yvonne691 2025-12-24T07:01:19 LoRa · 微调 · Adapter +0/-0 3 0

在大语言模型微调工程化实践中，Adapter模块与主干网络的融合是提升模型适应性的关键环节。本文将深入探讨两种主流融合方法：参数高效微调的Adapter模块设计与主干网络的集成方式。 Adapter模块设计 Adapter模块通常以轻量级全...

LLM微调工程化实践 Yvonne691 2025-12-24T07:01:19 LoRa · 微调 · Adapter +0/-0 3 0

工具使用指南：提升微调效率的8个实用脚本在大语言模型微调工程化实践中，高效的工具链是提升开发效率的关键。本文将分享8个可复现的实用脚本，专为LoRA和Adapter微调方案设计。 1. 数据预处理脚本 bash python prepro...

Yvonne691