用户主页 - 极简博客

开源大模型微服务治理落日余晖1 2025-12-24T07:01:19 Kubernetes · 微服务治理 · 大模型 +0/-0 12 0

基于Kubernetes的大模型管理踩坑记录最近在尝试将大模型服务化部署到Kubernetes集群时，遇到了不少问题。本文记录了从零搭建大模型微服务治理平台的实践过程。环境准备首先创建一个专门用于大模型服务的命名空间： bash ku...

模型压缩与量化技术栈落日余晖1 2025-12-24T07:01:19 PyTorch · 边缘计算 +0/-0 4 0

轻量级量化技术实践：在资源受限环境下的应用在AI模型部署过程中，量化技术是实现模型轻量化的关键手段。本文将通过实际案例演示如何在资源受限环境中应用量化技术。量化原理与工具选择以PyTorch为例，使用torch.quantizatio...

Java Spring Boot Actuator监控落日余晖1 2025-12-24T07:01:19 Spring Boot · 监控 +0/-0 4 0

Spring Boot监控配置实践总结在微服务架构中，Spring Boot应用的监控与健康检查至关重要。本文将分享一个完整的Actuator监控配置实践案例。基础配置首先，在 pom.xml 中添加必要依赖： xml <depend...

开源大模型微服务治理落日余晖1 2025-12-24T07:01:19 容器化 · 微服务治理 · 大模型 +0/-0 4 0

容器化部署中的大模型服务安全加固实践在大模型微服务化改造过程中，容器化部署已成为主流实践。本文将分享如何在Kubernetes环境中对大模型服务进行安全加固，确保服务稳定运行。安全加固策略 1. 资源限制配置 yaml apiVersi...

分布式大模型训练优化落日余晖1 2025-12-24T07:01:19 正则化 · 分布式训练 +0/-0 4 0

在分布式大模型训练中，正则化技术对训练稳定性的影响不容忽视。以L2正则化为例，在大规模分布式训练场景下，我们观察到不同正则化强度对收敛速度和模型泛化能力的显著影响。实验设置：使用PyTorch分布式训练框架，4卡V100集群，batch...

Linux内核与系统安全落日余晖1 2025-12-24T07:01:19 系统安全 · Linux内核 · 权限控制 +0/-0 4 0

系统安全加固：通过修改sysctl.conf配置提高内核安全性在Linux系统安全防护中，内核参数调优是构建安全基线的重要环节。本文将通过具体配置案例，展示如何通过调整 /etc/sysctl.conf 文件来增强系统的安全性。核心安全...

开源大模型微调与部署落日余晖1 2025-12-24T07:01:19 大模型 · 微调 +0/-0 2 0

大模型微调中的损失收敛性分析在大模型微调过程中，损失收敛性是衡量训练效果的核心指标。本文将从理论分析和实践角度，探讨如何有效监控和优化微调过程中的损失收敛行为。收敛性关键指标 python import matplotlib.pyplo...

Linux内核与系统安全落日余晖1 2025-12-24T07:01:19 安全审计 · 系统管理员 +0/-0 4 0

Linux系统安全审计：用户行为分析与异常访问检测在Linux系统安全管理中，用户行为分析是预防和检测潜在威胁的重要手段。本文将通过具体案例展示如何使用系统工具进行用户行为监控。 1. 基于auditd的用户活动监控首先安装auditd...

PyTorch深度学习模型优化实战落日余晖1 2025-12-24T07:01:19 PyTorch · 深度学习模型优化 · ONNX Runtime · TensorRT +0/-0 3 0

PyTorch模型部署工具对比：TensorRT vs ONNX Runtime 在实际生产环境中，PyTorch模型的部署优化至关重要。本文通过具体案例对比TensorRT和ONNX Runtime在性能上的差异。环境准备我们使用Re...

Python Django企业级应用开发落日余晖1 2025-12-24T07:01:19 Django · 数据库优化 · 企业级应用 +0/-0 2 0

在企业级Django应用开发中，数据库优化是提升系统性能的关键环节。本文将分享几个实用的优化策略。 1. 使用select related和prefetch related减少查询次数当处理外键关系时，使用select related可以...

落日余晖1