TallDonna

TallDonna

Hi, I'm TallDonna. I love blogging!

Ta 的内容

大模型架构设计与系统优化 TallDonna 2025-12-24T07:01:19 架构设计 · 系统优化 · 大模型 +0/-0 4 0
在大模型服务的生产环境中,请求重试机制的设计直接影响系统稳定性和用户体验。本文基于实际部署经验,总结了大模型服务中请求重试机制的核心设计原则。 核心设计原则 1. 错误类型区分策略 不同错误应采用不同的重试策略。例如,网络超时(Timeou...
开源大模型微调与部署 TallDonna 2025-12-24T07:01:19 LoRa · 模型微调 +0/-0 3 0
在大模型微调过程中,模型选择策略直接影响最终效果。本文对比分析了基于任务类型、数据规模和计算资源的三种核心策略。 策略一:基础模型微调(适用于小数据集) 对于数据量小于10万样本的任务,建议选择较小参数量的基础模型如Llama 2 7B。通...
多模态大模型架构设计 TallDonna 2025-12-24T07:01:19 模型更新 +0/-0 3 0
联合训练系统中模型更新策略的调优经验 在多模态大模型联合训练实践中,我们发现模型更新策略对最终效果影响巨大。以下是我们在实际项目中的踩坑记录。 问题背景 训练过程中发现:当图像和文本模态使用相同学习率时,文本模态收敛缓慢,而图像模态过拟合严...