用户主页 - 极简博客

开源大模型安全与隐私保护 ShallowMage 2025-12-24T07:01:19 LLM · 微调 +0/-0 14 0

在LLM微调过程中，学习率的设置是影响模型性能的关键因素之一。本文将分享一些实用的学习率设置技巧，并提供可复现的实验步骤。学习率的重要性学习率决定了模型参数更新的步长。过高的学习率可能导致训练不稳定甚至发散，而过低的学习率则会显著增加训...

大模型安全防护体系 ShallowMage 2025-12-24T07:01:19 安全测试 +0/-0 4 0

LLM安全测试用例设计方法论分享在大模型安全防护体系中，设计有效的测试用例是构建防御机制的关键环节。本文将分享一套可复现的LLM安全测试用例设计方法。测试用例分类框架对抗攻击测试用例输入扰动测试：添加噪声、对抗样本模型鲁棒性测试：...

大模型安全防护体系 ShallowMage 2025-12-24T07:01:19 +0/-0 2 0

大模型输入过滤机制的准确性验证实验背景针对大模型面临的投毒攻击威胁，我们构建了基于字符级和语义级双重过滤机制。通过对比实验验证不同过滤策略对攻击成功率的影响。实验设计测试集构建：从公开数据集提取1000条恶意输入样本，包含SQL注...

大模型安全防护体系 ShallowMage 2025-12-24T07:01:19 漏洞扫描 +0/-0 4 0

AI模型漏洞扫描工具准确性和效率对比实验实验背景针对大模型安全防护体系中的漏洞检测环节，我们对主流AI模型漏洞扫描工具进行了系统性对比测试。测试环境模型：BERT base、GPT 2 small、Llama 2 7b 工具：Dee...

模型压缩与量化技术栈 ShallowMage 2025-12-24T07:01:19 模型压缩 +0/-0 4 0

量化调优方法论：从参数量化到感知训练的整体路径在AI模型部署实践中，量化技术是实现模型轻量化的核心手段。本文将结合具体工具实践，梳理从基础量化到感知训练的完整优化路径。 1. 基础量化实践（PyTorch + TensorRT）使用Py...

模型压缩与量化技术栈 ShallowMage 2025-12-24T07:01:19 模型压缩 · TensorRT +0/-0 2 0

量化部署架构设计：多平台量化模型统一管理方案在AI模型部署实践中，量化技术已成为模型轻量化的核心手段。本文将通过实际案例展示如何构建统一的量化部署架构。架构概述采用分层设计思路：基础层为量化工具链，中间层为模型管理服务，上层为部署接口...

PyTorch深度学习模型优化实战 ShallowMage 2025-12-24T07:01:19 PyTorch · 性能优化 +0/-0 4 0

GPU利用率低下的诊断与优化方案在PyTorch模型推理过程中，GPU利用率低下是常见问题。以下提供具体解决方案。 1. 批处理优化 python 原始代码 model.eval() with torch.no grad(): for d...

大模型架构设计与系统优化 ShallowMage 2025-12-24T07:01:19 性能测试 · 系统优化 +0/-0 2 0

在大模型部署过程中，性能测试是确保系统稳定性和可扩展性的关键环节。本文基于实际部署经验，分享从压力测试到性能瓶颈识别的完整流程。 1. 测试环境搭建首先，我们需要构建一个与生产环境尽可能一致的测试环境。使用Docker Compose部署...

开源大模型测试与质量保障 ShallowMage 2025-12-24T07:01:19 自动化测试 · 质量保障 +0/-0 3 0

大模型测试用例的编写规范在开源大模型测试与质量保障社区中，编写高质量的测试用例是确保模型稳定性和可靠性的关键环节。本文将围绕大模型测试用例的编写规范进行深入探讨。测试用例结构规范一个完整的测试用例应包含：测试标题、前置条件、测试步骤、...

分布式大模型训练优化 ShallowMage 2025-12-24T07:01:19 性能调优 · 负载均衡 · 分布式训练 +0/-0 3 0

在多节点分布式训练环境中，负载均衡问题常常成为性能瓶颈。本文分享一个实际案例：某AI模型训练中发现节点间计算负载差异超过30%，严重影响整体训练效率。问题定位通过 nvidia smi 监控发现，部分GPU利用率长期维持在90%以上，而...

ShallowMage