用户主页 - 极简博客

Linux内核与系统安全 Xena308 2025-12-24T07:01:19 权限控制 · 系统加固 +0/-0 4 0

系统加固经验分享：基于内核版本的全面安全配置指南最近在为公司核心服务器进行安全加固时，踩了不少坑，特此记录一下。我们主要针对Linux内核安全进行了系统性配置，以下是一些实际可复现的操作步骤。 1. 内核参数配置首先，我们通过修改 /e...

大模型架构设计与系统优化 Xena308 2025-12-24T07:01:19 Redis · 缓存优化 · 大模型 +0/-0 4 0

基于Redis的大模型中间件缓存设计与调优踩坑记录最近在为一个大模型推理服务设计缓存层时，选择了Redis作为中间件缓存方案。结果踩了不少坑，分享一下经验。初始架构设计最初的设计思路是：将模型推理结果缓存到Redis中，通过key的前...

开源大模型训练与推理技术 Xena308 2025-12-24T07:01:19 PyTorch · 分布式训练 · 大模型 +0/-0 4 0

在开源大模型训练中，PyTorch分布式训练是提升训练效率的关键技术之一。本文将详细介绍如何配置和使用PyTorch的 torch.distributed 模块进行多GPU训练。核心参数解析 1. 初始化方法：使用 torch.dist...

Linux内核与系统安全 Xena308 2025-12-24T07:01:19 系统安全 +0/-0 3 0

perf工具在内核调用瓶颈定位中的实战踩坑记录最近在为一台高负载服务器进行性能分析时，遇到了一个典型的内核调用瓶颈问题。通过使用perf工具，我成功定位了问题根源，但过程中也踩了不少坑。问题背景某企业级应用在高峰期出现响应延迟严重的问...

开源大模型微服务治理 Xena308 2025-12-24T07:01:19 微服务 · 监控 · LLM +0/-0 4 0

LLM微服务监控指标体系构建方法在大模型微服务化改造过程中，构建完善的监控指标体系是保障系统稳定运行的关键。本文将分享一套可复现的LLM微服务监控指标构建方法。核心监控维度 1. 服务性能指标 python import prometh...

大模型数据工程与特征工程 Xena308 2025-12-24T07:01:19 机器学习 · 特征工程 · 数据预处理 +0/-0 2 0

在深度学习模型训练过程中，数据预处理阶段往往决定了模型性能的上限。本文将深入探讨数据预处理中的常见陷阱，并提供可复现的解决方案。常见数据预处理陷阱 1. 数据泄露问题在进行特征缩放时，若在训练集和测试集之间共享统计信息，会导致数据泄露。...

模型监控与性能追踪系统 Xena308 2025-12-24T07:01:19 DevOps · 模型监控 +0/-0 4 0

机器学习模型服务稳定性评估作为DevOps工程师，我们通过构建监控系统来保障模型服务的稳定性。以下是我们实际部署的监控方案。核心监控指标配置响应时间监控：设置P95响应时间阈值为200ms，超过此值触发告警。通过Prometheus...

LLM微调工程化实践 Xena308 2025-12-24T07:01:19 模型压缩 +0/-0 3 0

Adapter微调中的模型压缩策略在LLM微调工程化实践中，Adapter微调因其低资源消耗和快速部署的优势而备受关注。然而，当面对计算资源受限的场景时，如何进一步压缩Adapter模型成为关键挑战。压缩策略概述基于LoRA微调框架，...

LLM微调工程化实践 Xena308 2025-12-24T07:01:19 LoRA微调 +0/-0 3 0

Adapter微调中的冻结策略优化在LLM微调实践中，Adapter作为一种轻量级微调方案备受关注。最近在项目中尝试了不同冻结策略，踩了不少坑。问题背景在使用LoRA微调时，我们发现简单的全参数冻结效果不佳。通过实验对比，发现合理的冻...

React Server组件实践 Xena308 2025-12-24T07:01:19 性能测试 · 测试用例 +0/-0 4 0

React Server Component测试用例编写规范在React Server Component实践中，编写规范的测试用例至关重要。以下是一套完整的测试规范：基础测试结构 javascript import { renderT...

Xena308