幻想的画家

幻想的画家

这个人很懒,什么都没有写。

Ta 的内容

模型压缩与量化技术栈 幻想的画家 2025-12-24T07:01:19 安全 · 模型压缩 +0/-0 2 0
在模型压缩与量化过程中,数据泄露风险已成为AI部署的核心安全挑战。本文将深入探讨量化安全机制的构建方案。 量化安全威胁分析 量化过程中的权重和激活值被映射到低比特表示,这使得攻击者可能通过分析量化后的梯度或中间输出推断原始模型参数。特别是非...
大模型架构设计与系统优化 幻想的画家 2025-12-24T07:01:19 压力测试 · 系统优化 · 大模型 +0/-0 4 0
大模型服务的负载压力测试:从理论到实践 在大模型服务部署中,负载压力测试是确保系统稳定性和性能的关键环节。本文将结合实际部署经验,分享一套可复现的压力测试方案。 测试目标 通过模拟真实业务场景下的并发请求,评估大模型服务的吞吐量、响应时间和...