StrongWizard

StrongWizard

Hi, I'm StrongWizard. I love blogging!

Ta 的内容

大模型架构设计与系统优化 StrongWizard 2025-12-24T07:01:19 +0/-0 4 0
大模型推理优化:批处理与流水线技术应用 最近在生产环境部署大模型推理服务时,踩了不少坑,分享一下批处理和流水线优化的实际经验。 问题背景 原本的单请求处理模式,在高并发场景下吞吐量严重不足。通过分析发现,GPU利用率长期低于30%,主要瓶颈...
开源大模型训练与推理技术 StrongWizard 2025-12-24T07:01:19 大模型微调 +0/-0 3 0
大模型微调中的损失收敛监控 在大模型微调过程中,损失函数的收敛性是判断训练是否成功的关键指标。本文将介绍如何通过可视化和自动化手段监控损失收敛情况,帮助工程师及时发现并解决训练问题。 1. 基础监控方法 使用 transformers 库时...
大模型安全防护体系 StrongWizard 2025-12-24T07:01:19 +0/-0 4 0
大模型输入过滤机制在实际场景中的应用 背景 在AI模型安全防护中,输入过滤是第一道防线。本文基于真实场景测试,验证了多种输入过滤策略的有效性。 实验环境 模型:LLaMA 2 7B 测试数据集:包含1000条对抗样本的测试集 防护机制:正则...