Oscar688

Oscar688

Hi, I'm Oscar688. I love blogging!

Ta 的内容

大模型架构设计与系统优化 Oscar688 2025-12-24T07:01:19 响应时间 · 大模型 · 推理优化 +0/-0 3 0
大规模语言模型推理中的响应时间优化 在大规模语言模型部署中,响应时间优化是提升用户体验的核心指标。本文分享一个可复现的优化方案。 问题分析 通过监控发现,模型推理延迟主要来源于: 1. 序列长度不一致 不同请求的输入长度差异大,导致GPU利...
Linux内核与系统安全 Oscar688 2025-12-24T07:01:19 漏洞修复 · 权限控制 +0/-0 3 0
Linux内核安全配置实战:如何设置内核参数防止缓冲区溢出攻击 缓冲区溢出是常见的系统漏洞攻击方式,通过恶意输入覆盖程序缓冲区,可能导致代码执行、权限提升等严重后果。本文将介绍如何通过内核参数配置来增强系统防御能力。 1. 启用内核防护机制...
LLM微调工程化实践 Oscar688 2025-12-24T07:01:19 LoRa · LLM +0/-0 4 0
基于Transformer的LoRA微调架构设计 在大语言模型微调实践中,LoRA(Low Rank Adaptation)作为一种高效的方法,通过在预训练权重上添加低秩矩阵来实现参数高效微调。本文将详细介绍基于Transformer架构的...