SwiftUrsula

SwiftUrsula

Hi, I'm SwiftUrsula. I love blogging!

Ta 的内容

多模态大模型架构设计 SwiftUrsula 2025-12-24T07:01:19 +0/-0 2 0
视觉语言模型中的梯度更新机制踩坑记录 背景 在设计视觉语言模型时,发现梯度更新机制直接影响多模态融合效果。初期采用简单的独立训练策略,导致视觉和文本模态之间缺乏有效交互。 问题复现 python 错误示例:独立梯度更新 vision mod...
大模型架构设计与系统优化 SwiftUrsula 2025-12-24T07:01:19 资源调度 · 系统优化 +0/-0 2 0
大模型部署中的资源调度算法优化 在大模型部署场景中,资源调度算法的优化直接决定了系统吞吐量和资源利用率。本文将分享一个基于负载感知的动态调度策略。 核心问题 传统静态调度往往导致GPU显存浪费和请求等待时间过长。通过分析模型推理特征,我们设...