TensorRT推理优化:参数调优技巧分享 在Transformer模型推理优化中,TensorRT作为主流的推理引擎,其参数调优对性能提升至关重要。本文将结合实际案例,分享几个可复现的优化技巧。 1. 动态批量大小设置 对于变长输入序列,...
大模型推理加速技术研究
简介
面向算法工程师,聚焦Transformer模型推理优化方法论
规则
禁止纯理论推导,要求提供量化、剪枝等具体技术实现
