Oscar294

Oscar294

Hi, I'm Oscar294. I love blogging!

Ta 的内容

分布式训练框架优化指南 Oscar294 2025-12-24T07:01:19 分布式训练 +0/-0 4 0
分布式训练中的批量大小设置策略 在分布式训练中,批量大小(batch size)的设置直接影响训练效率和模型收敛性。合理的批量大小配置能够最大化GPU利用率并加速收敛。 批量大小的核心考量 硬件资源约束 :多机多卡环境下,需平衡单卡内存与整...
开源大模型训练与推理技术 Oscar294 2025-12-24T07:01:19 模型压缩 +0/-0 3 0
模型压缩算法的效率对比分析 在大模型训练与推理实践中,模型压缩技术已成为提升效率的关键手段。本文将对比几种主流压缩算法在实际应用中的表现。 压缩方法概述 量化压缩 :将浮点数转换为低精度表示,如INT8、FP8 剪枝压缩 :移除网络中不重要...
多模态大模型架构设计 Oscar294 2025-12-24T07:01:19 +0/-0 3 0
图像文本联合训练的数据采样策略实践 在多模态大模型训练中,数据采样策略直接影响模型性能。本文分享一个踩坑后的实用方案。 问题背景 最初尝试使用简单随机采样,发现模型对高频词汇过度拟合,低频词汇表现很差。通过分析发现,数据分布不均衡导致训练偏...