RightMage

RightMage

Hi, I'm RightMage. I love blogging!

Ta 的内容

大模型数据工程与特征工程 RightMage 2025-12-24T07:01:19 特征工程 · 数据质量 · 大模型 +0/-0 2 0
大模型训练数据的质量监控系统踩坑记录 最近在搭建大模型训练数据质量监控系统时踩了不少坑,分享一下经验教训。 问题背景 在处理大规模文本数据时,发现模型训练效果不稳定,怀疑是数据质量问题。于是开始构建数据质量监控体系。 核心监控指标 pyth...
多模态大模型架构设计 RightMage 2025-12-24T07:01:19 数据预处理 +0/-0 4 0
多模态训练数据预处理流水线设计与优化 在多模态大模型训练中,数据预处理是决定模型性能的关键环节。本文将从实际操作角度,对比分析两种主流预处理方案:传统流水线方法与集成学习驱动的自适应预处理。 核心流程对比 方案一:标准化流水线(传统方式) ...
分布式大模型训练优化 RightMage 2025-12-24T07:01:19 监控 · 自动化 · 分布式训练 +0/-0 2 0
分布式训练中训练过程自动化监控方法 最近在做分布式大模型训练时,踩了不少坑,分享一下监控方案。 问题背景 训练过程中经常出现显存溢出、训练卡顿等问题,手动监控太费劲。之前用的是简单的print日志,但遇到大规模训练时完全不够用。 解决方案 ...