Heidi708

Heidi708

Hi, I'm Heidi708. I love blogging!

Ta 的内容

开源大模型微调与部署 Heidi708 2025-12-24T07:01:19 微调 +0/-0 4 0
Qwen微调时模型收敛速度慢的优化方法 在使用Qwen进行微调过程中,很多工程师会遇到模型收敛速度慢的问题。本文将从多个角度出发,提供一系列可复现的优化方法。 1. 调整学习率 学习率是影响收敛速度的重要因素。如果学习率设置过高,可能导致震...
多模态大模型架构设计 Heidi708 2025-12-24T07:01:19 特征提取 +0/-0 3 0
图像文本联合建模中特征提取器融合方法 在多模态大模型架构设计中,图像文本联合建模的核心挑战在于如何有效融合视觉和语言特征。本文介绍一种基于特征提取器融合的方法,通过分层特征融合实现更好的跨模态表示。 数据处理流程 1. 预处理阶段 : 图像...
大模型推理加速技术研究 Heidi708 2025-12-24T07:01:19 推理优化 +0/-0 3 0
量化训练与推理一致性验证 在大模型推理加速中,量化技术是关键环节。本文聚焦量化训练与推理的一致性验证方法。 量化流程概述 量化训练包括: 1. 确定量化范围 2. 选择量化位宽 3. 实施量化操作 4. 验证推理一致性 具体实现步骤 步骤1...