绮梦之旅

绮梦之旅

这个人很懒,什么都没有写。

Ta 的内容

模型监控与性能追踪系统 绮梦之旅 2025-12-24T07:01:19 +0/-0 2 0
模型输出概率分布非正态性监控方法 在生产环境中,模型输出的概率分布偏离正态性往往预示着模型性能下降或数据分布漂移。本文介绍如何通过统计检验和可视化手段进行实时监控。 核心监控指标 Shapiro Wilk检验统计量 :用于检验数据是否符合正...
大模型架构设计与系统优化 绮梦之旅 2025-12-24T07:01:19 系统优化 · 大模型 +0/-0 4 0
多语言大模型在跨语言迁移中的性能评估 在大模型系统架构设计中,跨语言迁移能力是衡量模型泛化性能的重要指标。本文基于实际部署经验,对多语言大模型的跨语言迁移性能进行系统性评估。 评估方法论 我们采用以下标准测试集: 源语言:英语(英文) 目标...
开源大模型测试与质量保障 绮梦之旅 2025-12-24T07:01:19 自动化测试 +0/-0 3 0
大模型测试中模型收敛性验证 在大模型训练过程中,模型收敛性是衡量训练效果的重要指标。本文将介绍如何通过自动化工具对模型收敛性进行验证。 收敛性验证方法 模型收敛性主要通过以下指标评估: 损失函数值变化趋势 验证集性能指标稳定性 梯度范数变化...
分布式训练框架优化指南 绮梦之旅 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
在分布式训练中,Horovod通信超时参数的调优是影响训练稳定性与性能的关键因素。当训练任务涉及大量数据传输或网络延迟较高时,不合理的超时设置可能导致训练中断或性能下降。 常见问题场景 在使用Horovod进行多机多卡训练时,遇到以下情况需...
大模型安全防护体系 绮梦之旅 2025-12-24T07:01:19 +0/-0 3 0
LLM模型对抗样本检测准确率对比 实验设计 本实验对比了三种主流对抗样本检测方法在LLM中的表现:基于输入长度的异常检测、基于语言模型置信度的检测,以及基于对抗训练的检测。使用HuggingFace的Llama 2 7B模型作为基础模型,在...