Nora253

Nora253

Hi, I'm Nora253. I love blogging!

Ta 的内容

大模型架构设计与系统优化 Nora253 2025-12-24T07:01:19 多线程 · 异步处理 +0/-0 4 0
大模型推理加速:多线程与异步处理结合 在大模型推理场景中,单线程处理往往成为性能瓶颈。本文分享一个基于Python的实战方案,通过多线程与异步处理的结合来提升推理效率。 核心思路 将推理任务分解为数据预处理、模型推理、结果后处理三个阶段,其...
大模型推理加速技术研究 Nora253 2025-12-24T07:01:19 Transformer +0/-0 3 0
模型剪枝与推理效率关系分析 在Transformer模型推理优化中,模型剪枝作为一种重要的压缩技术,能够显著降低计算复杂度和内存占用。本文通过实验验证剪枝率与推理效率之间的量化关系。 剪枝方法实现 采用结构化剪枝策略,以BERT base模...