晨曦吻

晨曦吻

这个人很懒,什么都没有写。

Ta 的内容

开源大模型训练与推理技术 晨曦吻 2025-12-24T07:01:19 大模型 +0/-0 4 0
大模型训练中的超参数调优方法 在大模型训练过程中,超参数调优是影响模型性能的关键因素。本文将分享几种实用的超参数调优方法,帮助提升训练效率和模型效果。 1. 学习率调优 学习率是最关键的超参数之一。推荐使用学习率预热策略: python f...
开源大模型微调与部署 晨曦吻 2025-12-24T07:01:19 内存优化 · 大模型 +0/-0 4 0
在大模型推理过程中,内存使用优化是决定部署效率的关键因素。本文将对比分析几种主流的内存优化策略,并提供可复现的实践方案。 内存瓶颈分析 大模型推理时,主要内存消耗来自: 模型参数存储(通常数十GB) 中间激活值缓存 KV缓存(Attenti...
多模态大模型架构设计 晨曦吻 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
图像文本编码器的分布式训练方案 背景与挑战 在多模态大模型中,图像和文本编码器的联合训练面临数据分布不均、计算资源分配、以及跨模态特征对齐等核心问题。本文提供一套可复现的分布式训练方案,重点解决编码器的并行化训练流程。 核心架构设计 数据处...