用户主页 - 极简博客

Linux内核与系统安全 Judy370 2025-12-24T07:01:19 系统安全 · Linux内核 +0/-0 4 0

在Ubuntu服务器安全优化中，通过调整内核参数可以显著提升系统安全性。本文将介绍几个关键的内核参数配置案例，帮助系统管理员增强服务器防护能力。 1. 禁用IP转发对于不使用路由功能的服务器，应禁用IP转发以减少攻击面： echo 'ne...

开源大模型微服务治理 Judy370 2025-12-24T07:01:19 微服务 · 服务治理 · LLM +0/-0 4 0

在LLM微服务架构中，服务注册与发现是保障系统稳定运行的核心机制。本文将探讨如何在大模型微服务化改造中实现高效的服务治理。核心原理服务注册与发现本质上是解决服务间通信问题的方案。当微服务启动时，需要向注册中心注册自身信息（IP、端口、健...

大模型架构设计与系统优化 Judy370 2025-12-24T07:01:19 系统架构 · 延迟优化 +0/-0 3 0

大规模语言模型推理延迟控制方案在大模型系统架构设计中，推理延迟控制是决定用户体验的关键因素。本文将从实际部署角度，对比分析几种主流延迟控制方案。延迟控制方案对比 1. 批处理优化方案通过增加批处理大小来提升吞吐量，但会增加单个请求的延...

大模型测试中的并发控制

开源大模型测试与质量保障 Judy370 2025-12-24T07:01:19 并发控制 · 质量保障 +0/-0 4 0

在大模型测试中，并发控制是确保测试结果准确性和系统稳定性的重要环节。本文将通过对比分析几种主流的并发控制方案，并提供可复现的测试代码。并发控制挑战大模型测试通常涉及大量并行请求处理，常见的问题包括：资源竞争、数据一致性丢失、性能瓶颈等。...

开源大模型微调与部署 Judy370 2025-12-24T07:01:19 大模型 · 生产部署 · 推理优化 +0/-0 3 0

大模型推理速度慢的原因分析在实际生产环境中，大模型推理速度慢是一个常见问题。本文将从硬件、软件和模型结构三个维度分析原因，并提供可复现的优化方案。常见原因分析 1. 硬件资源瓶颈 GPU显存不足导致频繁的内存交换 CPU性能不足影响数据...

LLM微调工程化实践 Judy370 2025-12-24T07:01:19 LoRa · Adapter +0/-0 3 0

在LLM微调工程化实践中，GPU资源利用率直接影响训练效率。本文分享基于LoRA和Adapter的优化方案。问题分析传统全参数微调存在显存占用高、训练速度慢的问题。通过LoRA（Low Rank Adaptation）技术，我们仅训练低...

开源大模型微服务治理 Judy370 2025-12-24T07:01:19 微服务 · 日志分析 · 大模型 +0/-0 2 0

在大模型微服务架构下，日志分析成为治理的关键环节。本文将探讨如何通过结构化日志收集和分析来提升大模型服务的可观测性。日志收集策略首先需要建立统一的日志采集框架。使用Prometheus + Grafana组合，通过配置文件定义日志采集规...

分布式大模型训练优化 Judy370 2025-12-24T07:01:19 性能监控 · 分布式训练 +0/-0 2 0

在分布式大模型训练中，训练过程参数监控是性能调优的核心环节。本文将分享一套可复现的参数监控方案。核心监控指标 Loss变化趋势（每500步记录） GPU显存使用率（实时监控）通信带宽利用率梯度范数变化可复现步骤： 1. 使用PyT...

Linux内核与系统安全 Judy370 2025-12-24T07:01:19 漏洞修复 · 系统管理员 +0/-0 3 0

在Linux系统安全实践中，内核漏洞修复是系统管理员的核心职责之一。本文将通过对比两种主流自动化漏洞修复工具—— kernel panic 和 grsecurity 的配置流程，为安全工程师提供可复现的修复方案。首先，以 kernel p...

LLM微调工程化实践 Judy370 2025-12-24T07:01:19 数据处理 · LoRa +0/-0 2 0

Adapter微调中的数据处理技术踩坑记录在LLM微调工程化实践中，Adapter微调因其低资源消耗和高灵活性成为热门方案。本文记录我在实际项目中遇到的数据处理问题。问题背景使用LoRA+Adapter混合微调框架时，发现模型在特定领...

Judy370