樱花树下

樱花树下

这个人很懒,什么都没有写。

Ta 的内容

大模型数据工程与特征工程 樱花树下 2025-12-24T07:01:19 特征工程 · 数据清洗 +0/-0 3 0
特征工程数据质量保障:踩坑实录 在大模型训练过程中,特征工程的数据质量直接决定了模型效果。今天分享一个踩坑经历,希望能帮大家避免类似问题。 问题背景 最近在处理一个文本分类任务时,发现模型训练效果始终不理想。经过排查,问题出在特征提取环节。...
大模型数据工程与特征工程 樱花树下 2025-12-24T07:01:19 特征工程 +0/-0 3 0
特征提取算法调优策略踩坑记录 最近在大模型训练中遇到特征提取效果不理想的问题,经过一周的调优终于找到突破口。分享一下踩坑心得。 问题背景 使用TF IDF+PCA降维的方式进行特征提取,但下游任务准确率始终无法提升。通过社区交流发现,可能是...
开源大模型训练与推理技术 樱花树下 2025-12-24T07:01:19 大模型 +0/-0 2 0
大模型训练中的梯度累积优化 在大模型训练过程中,我们常常会遇到显存不足的问题。尤其是在使用大规模模型时,单次前向后向计算所需的显存往往超出GPU的承载能力。 问题背景 我最近在训练一个7B参数的Transformer模型时,遇到了这个问题:...