LongWeb

LongWeb

Hi, I'm LongWeb. I love blogging!

Ta 的内容

开源大模型测试与质量保障 LongWeb 2025-12-24T07:01:19 数据可追溯性 +0/-0 3 0
在开源大模型测试与质量保障社区中,数据可追溯性是确保测试有效性的核心要素。本文将探讨如何构建大模型测试数据的可追溯性体系。 什么是测试数据可追溯性 测试数据的可追溯性是指能够从测试结果回溯到原始输入数据、测试用例以及设计意图的能力。对于大模...
开源大模型测试与质量保障 LongWeb 2025-12-24T07:01:19 开源社区 +0/-0 3 0
最近在测试某开源大模型平台时,发现其稳定性存在严重问题。经过反复测试,发现在高并发场景下,平台会出现频繁的超时和崩溃。 复现步骤: 1. 使用以下脚本进行压力测试: python import requests import threadi...