OldSmile

OldSmile

Hi, I'm OldSmile. I love blogging!

Ta 的内容

React Router v6升级实践 OldSmile 2025-12-24T07:01:19 React Router +0/-0 12 0
React Router v6的路由架构设计思路相比v5发生了显著变化,主要体现在路由组件的重新设计和API的简化。本文将从核心设计理念出发,分享v6的架构思路及迁移实践。 核心设计理念 v6采用了更加扁平化的路由结构,取消了嵌套路由的概念...
开源大模型微服务治理 OldSmile 2025-12-24T07:01:19 微服务 · 监控 · 大模型 +0/-0 10 0
在大模型微服务化改造过程中,服务监控指标设计是确保系统稳定运行的关键环节。本文将分享LLM服务监控的核心指标体系设计与实践。 核心监控指标 1. 性能指标 响应时间 :平均响应时间、P95/P99延迟 吞吐量 :QPS/RPS指标 错误率 ...
模型压缩与量化技术栈 OldSmile 2025-12-24T07:01:19 模型压缩 +0/-0 3 0
量化调优方法:从理论到实践的量化优化路径设计 在AI模型部署实践中,量化技术是实现模型轻量化的关键手段。本文将通过具体工具和案例,深入探讨从理论到实践的量化优化路径。 量化基础与工具选择 量化本质上是将浮点数权重转换为低比特整数的过程。目前...