用户主页 - 极简博客

开源大模型安全与隐私保护 Diana73 2025-12-24T07:01:19 安全测试 · 大模型 +0/-0 7 0

大模型推理中Token生成效率优化在大模型推理过程中，Token生成效率直接影响了模型的响应速度和资源利用率。本文将从实际应用场景出发，分享几种有效的优化方法。 1. Beam Search优化策略 python from transfo...

Linux内核与系统安全 Diana73 2025-12-24T07:01:19 Linux内核 · 安全配置 +0/-0 4 0

CVE 2021 3696内核漏洞修复对比分析 CVE 2021 3696是一个影响Linux内核的权限提升漏洞，主要存在于FUSE（用户空间文件系统）子系统中。该漏洞允许本地攻击者通过恶意构造的FUSE挂载点获取root权限。 Ubunt...

模型监控与性能追踪系统 Diana73 2025-12-24T07:01:19 模型监控 +0/-0 3 0

机器学习模型训练过程中的学习率调整监控在ML流水线中，学习率作为核心超参数，其动态变化直接影响模型收敛性能。本文基于Prometheus + Grafana构建学习率监控体系。核心监控指标学习率值： learning rate{mo...

分布式大模型训练优化 Diana73 2025-12-24T07:01:19 性能调优 · 超参优化 +0/-0 4 0

在Ray分布式训练框架中，任务调度优化是提升大规模模型训练效率的关键环节。本文分享一套可复现的调度优化方案。问题分析：使用Ray Train时发现，训练任务经常出现资源争抢导致的性能瓶颈。通过 ray.init() 初始化时设置 num...

开源大模型微调与部署 Diana73 2025-12-24T07:01:19 并发性能 · 部署优化 +0/-0 4 0

在开源大模型推理场景中，并发性能瓶颈是部署过程中常见的问题。本文将通过一个具体的排查案例，分享如何定位和解决并发性能瓶颈。现象描述在使用Llama2 7B模型进行推理时，发现随着并发数增加，响应时间急剧上升，QPS下降明显。通过监控发现...

开源大模型微调与部署 Diana73 2025-12-24T07:01:19 +0/-0 3 0

Qwen微调过程中模型精度提升技巧记录在实际的Qwen微调项目中，我们通过一系列优化策略显著提升了模型精度。以下是一些可复现的实践经验。 1. 数据预处理优化数据质量直接影响微调效果。我们采用以下方法清洗和增强训练数据： python ...

开源大模型微调与部署 Diana73 2025-12-24T07:01:19 Kubernetes · 资源调度 +0/-0 4 0

在开源大模型部署实践中，Kubernetes资源调度是一个常见但容易忽视的环节。本文将分享在实际部署过程中遇到的典型问题及解决方案。问题场景当我们使用helm chart部署大模型服务时，发现Pod经常处于Pending状态。通过 ku...

开源大模型微调与部署 Diana73 2025-12-24T07:01:19 大模型微调 +0/-0 4 0

在开源大模型训练过程中，NaN值问题是一个常见但棘手的故障。本文将从多个维度系统性地分析和排查方法。现象描述训练过程中loss突然变为NaN，模型权重出现异常值，或者梯度爆炸导致数值溢出。这通常出现在大规模模型训练、混合精度训练或数据预...

React Router v6升级实践 Diana73 2025-12-24T07:01:19 React-Router · 路由优化 +0/-0 2 0

React Router v6的路由路径优化实践在React Router v6版本中，路由路径的处理方式发生了重大变化。从v5的 <Route 组件直接嵌套，到v6的 <Routes 容器配合 useRoutes 钩子，这种重构让路由配...

大模型架构设计与系统优化 Diana73 2025-12-24T07:01:19 系统优化 · 稳定性 · 大模型 +0/-0 3 0

大模型服务的稳定性保障机制在大模型服务的实际部署中，稳定性是核心考量因素。本文分享一套行之有效的稳定性保障机制。 1. 资源隔离与限流控制通过Kubernetes的资源配额机制实现容器间资源隔离： yaml apiVersion: v1...

Diana73