WetWeb

WetWeb

Hi, I'm WetWeb. I love blogging!

Ta 的内容

分布式训练框架优化指南 WetWeb 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
在分布式训练中,GPU内存使用率的优化是提升训练效率的关键因素之一。本文将通过实际案例分享如何有效提升GPU内存使用率。 问题分析 在多机多卡训练中,常见的GPU内存瓶颈包括: 梯度同步时的内存开销 数据并行传输中的临时存储 模型参数复制带...
分布式训练框架优化指南 WetWeb 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
Horovod训练框架性能评估 在多机多卡分布式训练环境中,Horovod作为主流的分布式训练框架,其性能表现直接影响模型训练效率。本文将通过实际测试对比不同配置下的训练性能。 环境准备 安装必要组件 pip install horovod...
大模型推理加速技术研究 WetWeb 2025-12-24T07:01:19 推理优化 +0/-0 3 0
神经网络推理优化技术对比 作为一名在大模型推理领域摸爬滚打的算法工程师,今天来分享几个实用的推理加速技术对比。我们主要从量化、剪枝和蒸馏三个维度进行实测。 1. 量化对比 我用PyTorch对BERT模型进行了INT8量化测试,使用torc...
开源大模型测试与质量保障 WetWeb 2025-12-24T07:01:19 自动化测试 +0/-0 3 0
大模型测试中的模型可复现性验证 在大模型测试中,可复现性是保证测试结果有效性的核心要素。本文将介绍如何通过系统化方法验证模型的可复现性。 可复现性定义 模型可复现性指在相同输入条件下,模型输出结果保持一致的能力。这包括: 相同输入得到相同输...