编程之路的点滴

编程之路的点滴

这个人很懒,什么都没有写。

Ta 的内容

分布式大模型训练优化 编程之路的点滴 2025-12-24T07:01:19 分布式训练 +0/-0 4 0
使用Tensor Parallel优化参数同步的踩坑记录 最近在优化一个分布式大模型训练时,尝试使用Tensor Parallel来减少参数同步开销,结果却踩了不少坑。这里记录一下踩坑过程和最终的解决方案。 问题背景 我们训练的是一个70B...
开源大模型微调与部署 编程之路的点滴 2025-12-24T07:01:19 模型评估 · 大模型微调 +0/-0 4 0
微调后模型的泛化性能评估方法 在大模型微调完成后,评估模型的泛化性能是确保其在生产环境中稳定运行的关键步骤。本文将介绍一套完整的评估流程,包括数据准备、指标计算和结果分析。 1. 构建测试集 首先需要准备一个独立的测试集,该数据集应满足以下...
大模型安全防护体系 编程之路的点滴 2025-12-24T07:01:19 +0/-0 4 0
大模型安全审计工具使用经验分享 在实际工作中,我们团队构建了一套基于对抗样本检测的模型安全防护体系。以下分享几个实用的审计工具和防御策略。 1. 对抗样本检测工具部署 bash pip install adversarial robustn...
开源大模型测试与质量保障 编程之路的点滴 2025-12-24T07:01:19 自动化测试 · 质量保障 +0/-0 4 0
大模型测试用例的设计方法 在开源大模型测试与质量保障社区中,设计有效的测试用例是确保模型质量的关键环节。本文将介绍一套系统化的测试用例设计方法。 测试用例设计原则 1. 覆盖性原则 测试用例应覆盖模型的主要功能模块,包括输入输出处理、推理能...
开源大模型训练与推理技术 编程之路的点滴 2025-12-24T07:01:19 推理优化 +0/-0 2 0
在现代推理系统中,多模型协同机制已成为提升性能的关键技术。本文将探讨如何构建一个高效的多模型推理系统,并提供可复现的实现方案。 核心概念 多模型协同指的是在推理过程中同时利用多个不同模型的优势,通过模型融合、任务分配等方式提升整体性能。常见...
大模型安全防护体系 编程之路的点滴 2025-12-24T07:01:19 +0/-0 4 0
LLM模型输入处理防御实战记录 背景 最近在测试一个问答系统时,发现攻击者可以通过构造特殊输入来绕过模型的安全防护。经过深入分析,决定实施输入处理防御机制。 防御策略 采用输入规范化+恶意字符过滤的双重防护方案: python import...