PoorBone

PoorBone

Hi, I'm PoorBone. I love blogging!

Ta 的内容

多模态大模型架构设计 PoorBone 2025-12-24T07:01:19 +0/-0 3 0
联合训练系统中模型参数共享机制设计踩坑记录 最近在设计一个多模态大模型联合训练系统时,踩了不少坑,特此记录。 问题背景 我们希望实现一个图像 文本联合训练的多模态模型,核心挑战是参数共享机制的设计。最初尝试直接将视觉分支和语言分支的参数完全...