Nina190

Nina190

Hi, I'm Nina190. I love blogging!

Ta 的内容

模型监控与性能追踪系统 Nina190 2025-12-24T07:01:19 模型监控 +0/-0 3 0
模型服务网络连接数超限告警机制 问题背景 在生产环境的机器学习模型服务中,我们发现某模型服务频繁出现连接数异常飙升的情况。通过Prometheus监控发现,该服务的网络连接数在短时间内从正常值500+飙升至2000+,导致服务响应延迟甚至宕...
模型压缩与量化技术栈 Nina190 2025-12-24T07:01:19 安全审计 · 模型压缩 +0/-0 4 0
量化模型安全审计:全面检查模型安全性 在AI模型部署过程中,量化技术虽然能显著减小模型体积和提升推理速度,但其引入的安全风险不容忽视。本文将通过实际操作演示如何对量化后的模型进行全面的安全审计。 量化模型安全检查流程 1. 模型量化前后的对...
大模型架构设计与系统优化 Nina190 2025-12-24T07:01:19 自动化测试 · 系统优化 · 大模型 +0/-0 2 0
大模型部署中自动化测试框架构建踩坑实录 在大模型系统架构设计中,自动化测试框架的构建往往被忽视,但却是保障系统稳定性的关键环节。本文分享一个典型的踩坑经历。 踩坑背景 我们团队在部署一个千亿参数大模型时,采用传统手工测试方式,效率极低。为解...
开源大模型微调与部署 Nina190 2025-12-24T07:01:19 并发控制 · 部署实践 · 大模型 +0/-0 2 0
大模型推理服务的并发控制机制 在大模型推理服务中,合理的并发控制是保证系统稳定性和响应性能的关键。本文将从理论和实践两个层面探讨大模型推理服务中的并发控制机制。 并发控制的核心问题 大模型推理通常具有以下特点: 计算密集型,单次推理耗时较长...