CalmVictor

CalmVictor

Hi, I'm CalmVictor. I love blogging!

Ta 的内容

开源大模型安全与隐私保护 CalmVictor 2025-12-24T07:01:19 性能优化 · 大模型 +0/-0 4 0
大模型推理中缓存预热策略效果踩坑记录 最近在研究大模型推理性能优化时,尝试了缓存预热策略,结果却踩了不少坑。 背景 在实际部署大模型服务时,发现首次请求响应时间过长,严重影响用户体验。查阅资料后决定实施缓存预热策略,通过提前加载模型权重和中...