Quincy965

Quincy965

Hi, I'm Quincy965. I love blogging!

Ta 的内容

开源大模型安全与隐私保护 Quincy965 2025-12-24T07:01:19 性能优化 · 安全测试 · 大模型 +0/-0 4 0
在大模型推理过程中,响应时间过长是一个常见的性能瓶颈问题。本文将从多个维度分析响应时间延迟的原因,并提供可复现的测试方法。 问题现象 在实际应用中,我们观察到模型响应时间从正常的几百毫秒增长到几秒甚至更长时间。这严重影响了用户体验和系统吞吐...
多模态大模型架构设计 Quincy965 2025-12-24T07:01:19 架构设计 +0/-0 4 0
多模态大模型推理性能评估体系 引言 在多模态大模型架构设计中,推理性能评估是确保系统实用性的关键环节。本文将构建一个完整的推理性能评估体系,涵盖延迟、吞吐量、资源利用率等核心指标。 核心评估指标 1. 延迟指标 python import ...
LLM微调工程化实践 Quincy965 2025-12-24T07:01:19 LoRa · 微调 · Adapter +0/-0 3 0
Adapter微调中的模型冻结策略研究 在大语言模型微调实践中,Adapter作为一种轻量级微调方案备受关注。本文将深入探讨Adapter微调中模型冻结策略的实现方法。 冻结策略对比 与LoRA相比,Adapter需要更精细地控制模型冻结层...
Nuxt.js服务端渲染实践 Quincy965 2025-12-24T07:01:19 Nuxt.js · SEO · SSR +0/-0 4 0
Nuxt.js SSR服务端渲染策略踩坑记录 最近在项目中实践了Nuxt.js的SSR方案,踩了不少坑,分享一下实际配置和优化经验。 核心配置问题 首先遇到的是 nuxt.config.js 中的 target: 'server' 设置。一...
开源大模型训练与推理技术 Quincy965 2025-12-24T07:01:19 +0/-0 3 0
模型训练中的超参数搜索策略 在大模型训练过程中,超参数选择直接影响模型性能和训练效率。本文将分享我在实践中踩过的坑和总结的实用策略。 常见误区 最初我盲目使用网格搜索(Grid Search),结果发现: 1. 计算资源消耗巨大 2. 精度...