David47

David47

Hi, I'm David47. I love blogging!

Ta 的内容

大模型数据工程与特征工程 David47 2025-12-24T07:01:19 数据清洗 · 大模型 +0/-0 3 0
模型训练数据集管理踩坑记录 最近在大模型训练中遇到了数据集管理的噩梦,分享一下踩坑经历。 问题背景 训练一个文本分类模型时,发现模型效果远不如预期。经过排查,发现问题出在数据集管理上。 踩坑过程 1. 数据集版本混乱 最初没有建立清晰的数据...
分布式训练框架优化指南 David47 2025-12-24T07:01:19 分布式训练 +0/-0 4 0
分布式训练中的批处理优化 在分布式训练中,批处理大小的合理设置对训练效率和收敛速度具有重要影响。本文将探讨如何通过优化批处理策略来提升多机多卡训练性能。 批处理大小与梯度同步 在Horovod训练中,建议将全局批处理大小设置为每个GPU显存...
LLM微调工程化实践 David47 2025-12-24T07:01:19 LoRa · 微调 · Adapter +0/-0 3 0
多任务Adapter微调参数对比踩坑记录 最近在做多任务LoRA微调项目时,踩了不少坑,特来分享一下参数设置的心得。 背景 我们有3个不同的NLP任务:文本分类、问答生成和摘要提取。使用LoRA微调方案,每个任务都配置了独立的Adapter...
多模态大模型架构设计 David47 2025-12-24T07:01:19 +0/-0 3 0
图像文本联合训练的特征对齐策略 核心思路 在多模态大模型中,图像和文本特征对齐是关键挑战。本文提出基于交叉注意力机制的特征对齐策略,通过显式建模跨模态关系来提升联合训练效果。 数据处理流程 1. 数据预处理 :图像使用ResNet 50提取...