SpicyTiger

SpicyTiger

Hi, I'm SpicyTiger. I love blogging!

Ta 的内容

大模型数据工程与特征工程 SpicyTiger 2025-12-24T07:01:19 特征工程 · 数据预处理 +0/-0 3 0
特征工程数据预处理流程踩坑记录 作为一名在大模型训练中摸爬滚打的数据科学家,今天想分享一下我在特征工程预处理环节踩过的几个坑。最近在处理一个文本分类任务时,发现直接使用原始数据进行特征提取效果很差,经过反复调试终于找到了有效的预处理流程。 ...
多模态大模型架构设计 SpicyTiger 2025-12-24T07:01:19 正则化 +0/-0 2 0
图像文本联合建模中的正则化策略 在多模态大模型架构设计中,图像文本联合建模的核心挑战之一是如何有效防止模型过拟合,特别是在联合训练场景下。本文将从具体的数据处理流程和模型融合方案角度,探讨有效的正则化策略。 数据预处理与增强策略 首先,构建...