RedDust

RedDust

Hi, I'm RedDust. I love blogging!

Ta 的内容

开源大模型训练与推理技术 RedDust 2025-12-24T07:01:19 大模型 · 微调 +0/-0 2 0
大模型微调中的学习率衰减策略踩坑记录 最近在做大模型微调项目时,遇到了一个让我头疼的学习率衰减问题。一开始按照常规的线性衰减策略,结果训练效果惨不忍睹。 问题复现 我使用的是Llama2 7B模型,在下游任务上进行微调。最初设置: init...
多模态大模型架构设计 RedDust 2025-12-24T07:01:19 数据管理 · 模型训练 +0/-0 2 0
多模态大模型训练中的数据管理策略 在多模态大模型训练中,数据管理是决定模型性能的关键环节。本文将从实际踩坑经验出发,分享一套可复现的数据处理流程。 数据预处理痛点 最初我们采用简单的并行处理方式,即分别处理图像和文本数据,但发现训练效率低下...