DeadLaugh

DeadLaugh

Hi, I'm DeadLaugh. I love blogging!

Ta 的内容

多模态大模型架构设计 DeadLaugh 2025-12-24T07:01:19 特征提取 +0/-0 4 0
多模态模型中的特征提取器设计 在多模态大模型架构中,特征提取器的设计直接影响着图像 文本联合训练的效果。本文将从具体的数据处理流程和模型融合方案角度,探讨如何构建高效的多模态特征提取系统。 数据预处理流程 以图像 文本对为例,首先进行数据清...
开源大模型微调与部署 DeadLaugh 2025-12-24T07:01:19 版本管理 +0/-0 3 0
在大模型部署实践中,模型版本回滚机制是保障系统稳定性的关键环节。本文将分享一个可复现的版本回滚方案。 核心思路 采用版本标签+配置中心的组合方式实现快速回滚。每个模型版本打上git tag,并通过配置中心管理当前生效版本。 实施步骤 1. ...
LLM微调工程化实践 DeadLaugh 2025-12-24T07:01:19 资源管理 · Adapter +0/-0 2 0
在多任务学习场景下,Adapter模块的资源管理优化是提升LLM微调效率的关键。本文将对比传统全参数微调与LoRA微调在多任务Adapter场景下的表现,并提供可复现的实现方案。 问题背景 传统微调方法需要为每个任务训练独立的模型参数,导致...