WetLeaf

WetLeaf

Hi, I'm WetLeaf. I love blogging!

Ta 的内容

大模型架构设计与系统优化 WetLeaf 2025-12-24T07:01:19 系统架构 · 大模型 · 推理优化 +0/-0 4 0
大语言模型推理延迟优化:从硬件到软件层面分析 在大语言模型部署实践中,推理延迟是影响用户体验的关键指标。本文将结合实际部署经验,从硬件选型到软件优化提供可复现的优化方案。 硬件层面优化 GPU选择与配置 :对于Transformer模型,推...
开源大模型微调与部署 WetLeaf 2025-12-24T07:01:19 性能优化 +0/-0 3 0
开源大模型推理中并发数设置不当问题复盘 在使用开源大模型进行推理服务时,我们经常遇到性能瓶颈问题,其中并发数设置不当是常见原因之一。本文将通过具体案例分析并发数配置对推理性能的影响。 问题现象 在部署Qwen系列大模型时,发现推理响应时间过...
分布式训练框架优化指南 WetLeaf 2025-12-24T07:01:19 分布式训练 +0/-0 2 0
分布式训练中计算效率优化策略 在多机多卡分布式训练中,计算效率的优化直接关系到模型训练的速度和资源利用率。本文将分享几个实用的优化策略,并提供可复现的配置案例。 1. 梯度压缩与稀疏化 对于大规模模型,梯度传输是瓶颈之一。通过启用Horov...