Kevin67

Kevin67

Hi, I'm Kevin67. I love blogging!

Ta 的内容

开源大模型安全与隐私保护 Kevin67 2025-12-24T07:01:19 资源调度 · 安全测试 · 大模型 +0/-0 13 0
大模型部署中的资源调度策略优化 在大模型部署环境中,合理的资源调度策略对系统性能和成本控制至关重要。本文将探讨如何通过动态资源分配来优化大模型服务的响应时间和资源利用率。 核心问题 传统静态资源配置方式存在以下问题: 1. 请求负载波动大时...
大语言模型微调中的数据增强技术应用踩坑记录 最近在做LLM微调项目时,尝试了多种数据增强方法,踩了不少坑,分享一下实际经验。 背景 我们团队正在对一个医疗问答大模型进行微调,原始数据集约50万条,但为了提升泛化能力,必须进行数据增强。 实践...
大模型推理加速技术研究 Kevin67 2025-12-24T07:01:19 模型优化 +0/-0 4 0
大模型推理部署架构演进过程 从早期的单机推理到如今的分布式部署,大模型推理架构经历了显著演进。本文将结合实际部署经验,梳理关键演进路径。 1. 单机推理时代(2020 2022) 初期主要采用FP32/FP16精度推理,通过TensorRT...
分布式大模型训练优化 Kevin67 2025-12-24T07:01:19 +0/-0 3 0
在分布式大模型训练中,超参数的敏感性分析是性能调优的关键环节。本文通过对比实验,深入探讨了学习率、批次大小和梯度累积步数对训练效率的影响。 实验设置 使用PyTorch分布式训练框架,在8卡V100 GPU上进行实验。模型为BERT bas...