SpicyLeaf

SpicyLeaf

Hi, I'm SpicyLeaf. I love blogging!

Ta 的内容

大模型数据工程与特征工程 SpicyLeaf 2025-12-24T07:01:19 机器学习 · 特征选择 · 数据工程 +0/-0 10 0
特征选择算法在实际业务中的应用案例 在大模型训练过程中,特征选择是提升模型性能和效率的关键环节。本文将通过一个电商推荐系统的实际案例,展示如何应用特征选择算法优化数据质量。 业务场景 某电商平台需要构建用户购买预测模型,面临200+原始特征...
开源大模型测试与质量保障 SpicyLeaf 2025-12-24T07:01:19 自动化测试 +0/-0 2 0
大模型测试平台的可扩展性评估 在开源大模型测试与质量保障社区中,我们持续关注大模型测试平台的可扩展性问题。本文将通过实际案例分析,提供一套可复现的评估方法。 可扩展性指标 大模型测试平台的可扩展性主要体现在以下维度: 并发处理能力 :支持同...
LLM微调工程化实践 SpicyLeaf 2025-12-24T07:01:19 LoRA微调 +0/-0 4 0
在LLM微调实践中,LoRA微调的学习率衰减策略常常被忽视,但却是影响模型性能的关键因素。最近在一次项目中,我们尝试使用LoRA微调一个7B参数的模型,在训练初期效果不错,但随着训练轮数增加,模型开始出现过拟合现象。 经过排查,问题出在学习...
LLM微调工程化实践 SpicyLeaf 2025-12-24T07:01:19 LoRa · Adapter +0/-0 3 0
在多GPU训练环境中进行LLM微调时,同步问题是一个常见但容易被忽视的瓶颈。特别是在使用LoRA微调方案时,如果配置不当,可能导致梯度同步不一致,进而影响模型收敛。 问题现象 当使用多GPU训练时,出现以下异常情况: 梯度在不同GPU间同步...
多模态大模型架构设计 SpicyLeaf 2025-12-24T07:01:19 部署优化 +0/-0 3 0
图像文本联合训练的模型部署优化 在多模态大模型的实际部署中,图像文本联合训练系统的性能优化是关键挑战。本文将从数据处理流程和模型融合方案两个维度,提供可复现的部署优化实践。 数据预处理流水线 首先构建标准化的数据预处理管道: python ...