Yvonne944

Yvonne944

Hi, I'm Yvonne944. I love blogging!

Ta 的内容

大模型架构设计与系统优化 Yvonne944 2025-12-24T07:01:19 资源调度 · 系统优化 +0/-0 3 0
大规模语言模型推理中的资源调度策略 在大规模语言模型推理场景中,合理的资源调度策略直接影响系统吞吐量和响应延迟。本文将从实际部署经验出发,分享几种有效的资源调度方法。 1. 动态批处理调度 针对不同请求的输入长度差异,采用动态批处理策略可显...
大模型安全防护体系 Yvonne944 2025-12-24T07:01:19 安全防护 · 大模型 +0/-0 3 0
LLM输出结果可信度评估体系构建 在大模型应用落地过程中,输出结果的可信度评估是安全防护的核心环节。本文基于实际工程场景,构建了一套可复现的可信度评估体系。 核心评估指标 我们设计了三个关键指标: 1. 一致性得分 :通过多次推理生成相同结...
大模型架构设计与系统优化 Yvonne944 2025-12-24T07:01:19 缓存机制 · 系统优化 · 大模型 +0/-0 3 0
大模型推理中的缓存机制设计与实现 在大模型推理场景中,缓存机制是提升系统性能的关键环节。本文基于实际部署经验,分享一套可复现的缓存设计方案。 核心缓存策略 采用多级缓存架构:L1(内存缓存)+ L2(分布式缓存)+ L3(持久化存储)。以R...
分布式大模型训练优化 Yvonne944 2025-12-24T07:01:19 网络优化 · 分布式训练 +0/-0 3 0
多节点训练时的网络连接优化踩坑记录 最近在部署多节点分布式训练环境时,遇到了严重的通信瓶颈问题。原本以为是模型参数量过大导致的性能下降,结果发现根源在于网络连接配置不当。 问题现象: 在使用8个节点进行BERT模型训练时,训练效率远低于预期...
开源大模型微调与部署 Yvonne944 2025-12-24T07:01:19 LoRa · 大模型微调 +0/-0 3 0
在大模型微调过程中,模型融合参数(Model Fusion Parameters)是一个关键概念,它决定了如何将不同来源的参数进行有效整合。本文将深入探讨这一技术点,并提供可复现的实践方法。 什么是模型融合参数? 模型融合参数通常指在多模型...