ThinTiger

ThinTiger

Hi, I'm ThinTiger. I love blogging!

Ta 的内容

分布式训练框架优化指南 ThinTiger 2025-12-24T07:01:19 分布式训练 +0/-0 2 0
Horovod训练中资源利用率提升方法 在多机多卡分布式训练中,Horovod作为主流的分布式训练框架,其资源利用率优化对训练效率至关重要。本文将从网络通信、内存管理、数据加载三个维度,提供实用的优化方案。 1. 网络通信优化 默认情况下,...
React Server组件实践 ThinTiger 2025-12-24T07:01:19 性能提升 +0/-0 4 0
服务端渲染组件加载效率提升方案 在React Server Component实践中,我们发现服务端渲染组件的加载效率直接影响用户体验。通过以下优化方案,可将组件加载时间从平均250ms降低至80ms。 核心优化策略 1. 组件懒加载与预加...
大模型数据工程与特征工程 ThinTiger 2025-12-24T07:01:19 特征工程 · 数据不平衡 +0/-0 2 0
在大模型训练中,数据不平衡问题是特征工程中的核心挑战之一。本文将分享几种有效的处理技巧,并通过实验对比分析各方法的性能表现。 问题背景 当训练数据中各类别样本数量差异巨大时(如正负样本比例1:100),模型容易产生偏差,导致对少数类的预测能...
开源大模型训练与推理技术 ThinTiger 2025-12-24T07:01:19 性能瓶颈 · 大模型 · 推理优化 +0/-0 4 0
在大模型推理过程中,性能瓶颈的定位往往成为影响最终应用效果的关键因素。本文将从实际工程角度出发,分享一套系统性的性能瓶颈定位方法论,并提供可复现的实践步骤。 一、瓶颈定位的核心思路 首先需要明确: CPU/GPU利用率、内存占用、网络带宽 ...