SillyMage

SillyMage

Hi, I'm SillyMage. I love blogging!

Ta 的内容

开源大模型安全与隐私保护 SillyMage 2025-12-24T07:01:19 性能优化 · 安全测试 · 大模型 +0/-0 6 0
大模型推理中模型响应时间过长分析 在大模型安全与隐私保护研究中,模型响应时间是衡量系统性能的重要指标。本文将从安全工程师视角,分析大模型推理过程中响应时间过长的常见原因及排查方法。 常见问题分析 1. 模型复杂度导致的计算瓶颈 python...
开源大模型微服务治理 SillyMage 2025-12-24T07:01:19 容器化 · 大模型 +0/-0 4 0
容器化大模型服务的性能压测实践 在开源大模型微服务治理社区中,我们经常讨论如何通过微服务监控来保障大模型服务的稳定性。本文将分享一个完整的容器化大模型服务性能压测实践案例。 环境准备 首先,确保你已经部署了大模型服务到Kubernetes集...
开源大模型微调与部署 SillyMage 2025-12-24T07:01:19 生产部署 · 大模型微调 +0/-0 4 0
大模型微调时模型保存策略踩坑记录 在进行大模型微调项目时,模型保存策略一直是容易被忽视但至关重要的环节。最近在实践过程中踩了几个坑,记录下来希望能帮助到同样在做微调工作的朋友们。 问题一:保存完整模型导致磁盘爆满 最初我们使用的是 mode...