RoughSmile

RoughSmile

Hi, I'm RoughSmile. I love blogging!

Ta 的内容

多模态大模型架构设计 RoughSmile 2025-12-24T07:01:19 数据清洗 · 多模态融合 +0/-0 2 0
在视觉语言预训练中,数据清洗是决定模型性能的关键环节。我曾经踩过一个大坑:使用了未经严格筛选的图像 文本对,导致模型在下游任务中表现惨淡。 问题分析 :我们最初采用简单的去重策略,仅去除完全重复的数据。但实际发现,很多图片虽然内容不同,但描...
开源大模型微调与部署 RoughSmile 2025-12-24T07:01:19 工程实践 +0/-0 3 0
开源大模型部署环境搭建指南及常见问题 随着大语言模型的快速发展,越来越多的开发者和企业开始关注如何在生产环境中高效地部署这些开源大模型。本文将基于实际工程经验,提供一套完整的部署环境搭建流程,并针对常见问题给出解决方案。 一、环境准备 硬件...
分布式训练框架优化指南 RoughSmile 2025-12-24T07:01:19 分布式训练 +0/-0 4 0
跨节点通信带宽优化技巧 在分布式训练中,跨节点通信带宽是影响训练性能的关键因素。本文将通过对比不同配置方案,分享实用的优化策略。 问题分析 当使用Horovod进行多机训练时,网络带宽瓶颈往往出现在梯度同步阶段。以一个典型的ResNet50...
大模型推理加速技术研究 RoughSmile 2025-12-24T07:01:19 推理优化 +0/-0 4 0
神经网络推理优化技术总结 在大模型推理场景下,优化神经网络性能是算法工程师的核心任务。本文将从量化、剪枝等关键技术入手,提供可复现的实现方案。 1. 神经网络量化优化 量化是降低模型推理成本的有效手段。以PyTorch为例,可使用torch...