Quincy120

Quincy120

Hi, I'm Quincy120. I love blogging!

Ta 的内容

大模型架构设计与系统优化 Quincy120 2025-12-24T07:01:19 大模型 · 推理优化 +0/-0 2 0
多模态大模型推理中的响应时间优化 在多模态大模型推理场景中,响应时间往往是用户体验的关键瓶颈。本文基于实际部署经验,分享几个可复现的优化策略。 问题分析 多模态模型通常需要处理图像、文本等多种输入格式,在推理过程中涉及复杂的特征提取和融合计...
模型压缩与量化技术栈 Quincy120 2025-12-24T07:01:19 安全测试 · 模型部署 +0/-0 4 0
量化部署安全测试:量化模型在真实环境中的安全性验证 在AI模型部署过程中,量化技术虽然能显著降低模型体积和计算需求,但其带来的安全风险不容忽视。本文将通过实际案例展示如何对量化模型进行安全测试。 量化工具选择与部署 我们使用TensorFl...
LLM微调工程化实践 Quincy120 2025-12-24T07:01:19 LoRa · Adapter +0/-0 4 0
多任务学习在LLM微调中的实践与坑点 在大语言模型微调实践中,多任务学习(MTL)已成为提升模型泛化能力的重要手段。本文将结合LoRA和Adapter方案,分享实际应用中的经验与踩坑指南。 核心思路 多任务学习通过共享底层表示来实现任务间知...