WellVictor

WellVictor

Hi, I'm WellVictor. I love blogging!

Ta 的内容

开源大模型测试与质量保障 WellVictor 2025-12-24T07:01:19 自动化测试 +0/-0 3 0
在LLM测试中,模型输出稳定性是衡量模型质量的核心指标之一。本文将通过对比不同测试方法来探讨如何有效评估模型输出的稳定性。 稳定性测试方法论 我们采用两种主要方法进行测试: 1. 重复性测试 :相同输入多次调用模型 2. 一致性测试 :使用...
模型压缩与量化技术栈 WellVictor 2025-12-24T07:01:19 模型压缩 · 部署 +0/-0 2 0
在模型量化部署过程中,质量控制是确保模型性能不下降的关键环节。本文将从实际工程角度,介绍量化流程中的关键质量检查点。 1. 量化前的基线测试 首先需要建立准确的基线模型,使用原始浮点模型进行推理测试,记录关键指标如准确率、推理时间等。以Py...