用户主页 - 极简博客

大模型数据工程与特征工程 Charlie758 2025-12-24T07:01:19 文本分类 · 特征工程 · 数据预处理 +0/-0 9 0

文本分类任务中的数据预处理流程在大模型训练中，数据预处理是决定模型性能的关键环节。本文记录一次文本分类任务中的踩坑经历和优化方案。常见问题复盘首先遇到的最大问题是文本噪声污染。原始数据中包含大量HTML标签、特殊字符和乱码，直接使...

模型监控与性能追踪系统 Charlie758 2025-12-24T07:01:19 DevOps · TensorBoard · 模型监控 +0/-0 2 0

基于TensorBoard的模型训练过程监控监控指标配置在TensorBoard中配置关键训练指标监控： python import tensorflow as tf from datetime import datetime 创建日志...

模型监控与性能追踪系统 Charlie758 2025-12-24T07:01:19 特征工程 · 模型监控 +0/-0 3 0

机器学习模型输入特征重要性变化检测在生产环境中，模型性能下降往往源于输入数据分布的变化。通过监控特征重要性的变化，可以提前预警模型漂移。核心监控指标特征重要性差异：使用SHAP值计算当前与历史时期特征重要性差值 KL散度：衡量输入...

模型监控与性能追踪系统 Charlie758 2025-12-24T07:01:19 模型监控 +0/-0 4 0

模型输出结果分布偏移检测的自动化系统在机器学习模型部署后，输出分布偏移是导致模型性能下降的主要原因之一。本文将介绍如何构建一个自动化监控系统来检测模型输出分布的变化。核心监控指标 KL散度：计算当前输出分布与基线分布的KL散度，阈值设...

模型压缩与量化技术栈 Charlie758 2025-12-24T07:01:19 性能优化 · 部署 +0/-0 2 0

TensorRT量化实战环境准备：使用TensorRT 8.5+，PyTorch 1.12+ INT8量化步骤： python import torch import tensorrt as trt class Quantizatio...

开源大模型微服务治理 Charlie758 2025-12-24T07:01:19 DevOps实践 · 微服务治理 +0/-0 3 0

LLM微服务架构下的数据处理流程踩坑记录在将大语言模型微服务化改造过程中，我们遇到了一个典型的治理问题：数据在微服务间流转时出现的不一致现象。这个问题在DevOps实践中非常常见。问题复现步骤 1. 首先部署了三个微服务： prompt...

开源大模型微调与部署 Charlie758 2025-12-24T07:01:19 机器学习 · 数据分布 · 大模型微调 +0/-0 2 0

大模型微调时训练集与测试集分布差异分析在大模型微调实践中，训练集与测试集的分布差异是影响模型泛化能力的关键因素。本文将通过实际案例分析如何识别并处理这种差异。问题背景当使用不同来源或不同时间的数据进行微调时，训练集和测试集往往存在分布...

开源大模型训练与推理技术 Charlie758 2025-12-24T07:01:19 +0/-0 3 0

模型量化后精度下降原因分析：从INT8到FP16的精度对比实验在大模型训练与推理优化过程中，量化技术是提升推理效率的重要手段。然而，近期在社区中遇到多个关于模型量化后精度下降的问题，本文将通过一个完整的实验来复现并分析精度下降的原因。实...

多模态大模型架构设计 Charlie758 2025-12-24T07:01:19 +0/-0 3 0

基于孪生网络的图像文本匹配实现数据预处理流程首先对图像数据进行标准化处理： python import torch from torchvision import transforms class ImagePreprocessor: ...

大模型安全防护体系 Charlie758 2025-12-24T07:01:19 输入验证 +0/-0 4 0

LLM输入验证机制在实际场景中的表现踩坑实录最近在测试一个LLM安全防护系统时，发现输入验证机制存在严重漏洞。原本以为只要添加了输入长度限制和特殊字符过滤就能万无一失。实验环境 LLM模型：Llama2 7B 防御机制：输入长度限制(...

Charlie758