用户主页 - 极简博客

开源大模型微服务治理 FierceLion 2025-12-24T07:01:19 微服务 · 缓存策略 · 大模型 +0/-0 14 0

微服务架构中大模型缓存策略踩坑记录最近在为一个大模型微服务项目做缓存优化，踩了不少坑，分享一下经验。问题背景我们的大模型服务需要处理大量相似查询请求，直接调用模型API导致响应延迟和资源浪费。初步方案是引入Redis缓存，但实际效果并...

大模型数据工程与特征工程 FierceLion 2025-12-24T07:01:19 特征工程 · 数据预处理 · 大模型 +0/-0 11 0

大模型训练前数据预处理流程设计在大模型训练中，数据预处理是决定模型性能的关键环节。本文将介绍一套完整的数据预处理流程，帮助数据科学家构建高质量的训练数据集。 1. 数据清洗与去重 python import pandas as pd fr...

开源大模型测试与质量保障 FierceLion 2025-12-24T07:01:19 自动化测试 · 一致性检查 +0/-0 3 0

在大模型测试中，模型一致性检查是确保模型输出稳定性和可靠性的关键环节。本文将介绍如何通过自动化工具进行模型一致性验证，并提供可复现的测试方案。什么是模型一致性检查模型一致性检查主要验证相同输入在不同时间、不同环境下的输出是否一致。这包括...

数据预处理质量控制标准

大模型数据工程与特征工程 FierceLion 2025-12-24T07:01:19 质量控制 · 特征工程 · 数据预处理 +0/-0 4 0

数据预处理质量控制标准在大模型训练过程中，数据预处理的质量直接决定了模型性能的上限。本文将从数据清洗、特征工程和质量评估三个维度，建立一套可复现的质量控制标准。核心质量控制流程 1. 数据清洗标准化 python import pand...

模型压缩与量化技术栈 FierceLion 2025-12-24T07:01:19 性能评估 · 模型压缩 +0/-0 4 0

量化模型测试用例设计：基于实际业务场景的测试方案在AI部署实践中，量化模型的性能验证是确保模型轻量化效果的关键环节。本文以图像分类任务为例，设计可复现的量化测试方案。测试环境配置 bash pip install torch torch...

模型压缩与量化技术栈 FierceLion 2025-12-24T07:01:19 模型压缩 · TensorRT +0/-0 2 0

NVIDIA TensorRT vs Intel MKL 量化性能对比在AI模型部署实践中，量化是实现模型轻量化的关键环节。本文通过实际测试对比NVIDIA TensorRT和Intel MKL的量化工具链表现。测试环境模型：ResN...

TensorFlow Serving微服务架构实践 FierceLion 2025-12-24T07:01:19 TensorFlow · Docker · 性能优化 · 负载均衡 · Serving +0/-0 2 0

容器化环境下模型推理延迟优化方案踩坑记录：从600ms到80ms的优化之路最近在将TensorFlow Serving部署到生产环境时，遇到了一个典型的性能问题。最初使用Docker容器化部署后，模型推理延迟高达600ms，严重影响了用...

开源大模型微服务治理 FierceLion 2025-12-24T07:01:19 微服务 · 配置管理 · LLM +0/-0 2 0

LLM微服务配置自动同步方案在大模型微服务化改造过程中，配置管理是确保服务稳定运行的关键环节。本文分享一个基于Kubernetes ConfigMap和Operator模式的自动同步方案。核心思路通过监听ConfigMap变化，自动将...

大模型架构设计与系统优化 FierceLion 2025-12-24T07:01:19 微服务 · 系统优化 +0/-0 4 0

LLM服务架构演进史：从单体到微服务的实践总结在大模型服务的发展历程中，架构演进是决定系统可扩展性和维护性的关键因素。本文将结合实际部署经验，梳理从单体架构到微服务架构的演进路径。单体架构阶段早期LLM服务通常采用单体架构，所有功能模...

大模型数据工程与特征工程 FierceLion 2025-12-24T07:01:19 特征工程 · 数据预处理 +0/-0 2 0

在大模型训练中，特征缩放是特征工程的重要环节。本文将介绍几种常用的特征缩放技术及其在实际项目中的应用。标准化 (Standardization) 标准化是将特征转换为均值为0、标准差为1的分布，适用于大多数机器学习算法，特别是基于距离的算...

FierceLion