用户主页 - 极简博客

Linux内核与系统安全 LowEar 2025-12-24T07:01:19 系统安全 · Linux内核 +0/-0 3 0

CVE 2021 3690漏洞分析：Linux内核权限提升漏洞的发行版差异 CVE 2021 3690是一个影响Linux内核的权限提升漏洞，主要存在于ext4文件系统的inode处理逻辑中。该漏洞允许本地攻击者通过特制的文件操作获得roo...

Java Spring Boot Actuator监控 LowEar 2025-12-24T07:01:19 Spring Boot · 微服务监控 +0/-0 3 0

微服务监控系统容量规划与设计在微服务架构中，监控系统的容量规划是确保系统稳定运行的关键。本文将基于Spring Boot Actuator，介绍如何设计一个可扩展的监控系统。监控数据采集配置首先，在 application.yml 中...

开源大模型微服务治理 LowEar 2025-12-24T07:01:19 微服务 · Docker · 大模型 +0/-0 2 0

基于Docker的大模型服务部署调试在大模型微服务化改造过程中，容器化部署是关键环节。本文将介绍基于Docker的完整部署调试流程。环境准备 bash 安装Docker环境 sudo apt update sudo apt instal...

开源大模型训练与推理技术 LowEar 2025-12-24T07:01:19 故障恢复 · 容灾机制 +0/-0 4 0

大模型部署中的故障恢复与容灾机制在大模型训练和推理过程中，系统稳定性至关重要。本文将介绍几种关键的故障恢复与容灾策略。 1. 检查点与断点续训使用 torch.save() 保存模型状态是常见做法。在训练时设置定期检查点： python...

大模型安全防护体系 LowEar 2025-12-24T07:01:19 +0/-0 2 0

对抗攻击防御中的模型稳定性提升方案背景在大模型安全防护体系中，对抗攻击是核心威胁之一。通过在输入数据中添加微小扰动来误导模型输出，严重影响模型稳定性。核心防御策略 1. 输入验证与过滤使用基于统计的异常检测方法，对输入数据进行预处理...

GPU资源调度算法对比分析

分布式训练框架优化指南 LowEar 2025-12-24T07:01:19 分布式训练 +0/-0 4 0

GPU资源调度算法对比分析在多机多卡分布式训练中，GPU资源调度效率直接影响整体训练性能。本文将对比分析几种主流调度算法在Horovod和PyTorch Distributed环境下的表现。调度算法对比 1. 均匀分配算法该算法将GP...

LLM微调工程化实践 LowEar 2025-12-24T07:01:19 LoRa · 微调 · Adapter +0/-0 3 0

基于LoRA的模型压缩效率对比实验最近在做LLM微调工程化实践时，踩了不少坑，特来分享一下LoRA微调的实战经验。本文将通过具体实验对比不同LoRA配置下的模型压缩效果。实验环境模型：Llama 2 7B 数据集：Alpaca指令微调...

PyTorch深度学习模型优化实战 LowEar 2025-12-24T07:01:19 PyTorch +0/-0 2 0

GPU内存管理实战：PyTorch中显存分配与回收机制在PyTorch深度学习模型训练过程中，显存管理是影响性能的关键因素。本文将通过具体代码示例展示如何有效管理GPU显存。显存监控基础首先需要了解当前显存使用情况： python i...

开源大模型微服务治理 LowEar 2025-12-24T07:01:19 微服务 · 配置管理 · LLM +0/-0 4 0

LLM微服务配置管理工具推荐在大模型微服务化改造过程中，配置管理是确保服务稳定运行的关键环节。本文对比评测几款主流的配置管理工具。 1. Consul 作为服务发现和配置管理的成熟方案，Consul支持多数据中心部署，提供HTTP API...

PyTorch深度学习模型优化实战 LowEar 2025-12-24T07:01:19 PyTorch · 深度学习 · 模型压缩 +0/-0 4 0

PyTorch模型压缩对比测试：剪枝、量化、蒸馏效果分析在实际部署场景中，模型压缩是提升推理效率的关键手段。本文通过一个图像分类任务，对比了三种主流压缩方法：结构化剪枝、量化和知识蒸馏的效果。实验设置使用ResNet18作为基础模型，...

LowEar