用户主页 - 极简博客

开源大模型微服务治理 SmoothTears 2025-12-24T07:01:19 微服务 · 监控 · LLM +0/-0 9 0

在大模型微服务化改造过程中，监控平台的建设是保障系统稳定运行的关键环节。本文分享一个基于Prometheus和Grafana的LLM服务监控平台搭建实践。核心组件部署 1. 部署Prometheus服务器： yaml scrape con...

大模型数据工程与特征工程 SmoothTears 2025-12-24T07:01:19 特征工程 · 数据清洗 +0/-0 13 0

图像数据预处理流水线构建经验分享在大模型训练过程中，图像数据的预处理质量直接影响模型性能。本文将分享一个可复现的图像预处理流水线构建经验。核心问题在实际项目中，我们遇到多个图像数据集存在分辨率不一致、色彩空间混乱、标注缺失等问题，导致...

多模态大模型架构设计 SmoothTears 2025-12-24T07:01:19 特征提取 +0/-0 3 0

多模态模型中的特征提取网络：从理论到实践在多模态大模型架构设计中，特征提取网络是整个系统的核心组件。本文将深入探讨图像和文本特征提取的具体实现方案，并提供可复现的代码示例。传统vs现代特征提取方法传统的特征提取通常采用预训练CNN（如...

模型压缩与量化技术栈 SmoothTears 2025-12-24T07:01:19 模型压缩 · TensorFlow Lite +0/-0 2 0

量化模型架构设计：轻量级网络结构与压缩策略在AI部署场景中，模型压缩是实现边缘设备部署的关键。本文将结合实际工程实践，介绍如何通过量化技术实现模型轻量化。轻量级网络结构设计采用MobileNetV2作为基础网络，通过通道剪枝和深度可分...

Linux内核与系统安全 SmoothTears 2025-12-24T07:01:19 权限控制 +0/-0 2 0

内核安全架构：Linux中KASLR和KPTI技术的配置与应用在现代Linux系统安全架构中，KASLR（Kernel Address Space Layout Randomization）和KPTI（Kernel Page Table ...

大模型安全防护体系 SmoothTears 2025-12-24T07:01:19 +0/-0 2 0

在LLM安全防护中，输入长度限制是基础但关键的防御策略。本文通过对比实验验证不同长度限制对模型安全性的影响。实验设计：使用Llama2 7B模型，在对抗攻击测试集上进行长度限制优化实验。设置三个输入长度限制：512 tokens、102...

大模型推理加速技术研究 SmoothTears 2025-12-24T07:01:19 模型压缩 +0/-0 3 0

模型压缩效果量化评估方法在Transformer模型推理优化中，模型压缩技术（如剪枝、量化）的效果评估是关键环节。本文将介绍一套可复现的量化评估方法。 1. 基准测试环境设置 python import torch import torc...

开源大模型微服务治理 SmoothTears 2025-12-24T07:01:19 微服务 · 资源限制 · 大模型 +0/-0 3 0

在微服务架构中，大模型服务的资源限制是保障系统稳定性的关键环节。本文将通过实际案例分享如何在Kubernetes环境中对大模型服务进行资源限制配置。问题背景大模型服务通常需要大量内存和CPU资源，在没有合理限制的情况下，单个服务可能耗尽...

开源大模型微调与部署 SmoothTears 2025-12-24T07:01:19 模型验证 · 生产部署 · 大模型微调 +0/-0 3 0

大模型微调验证方法踩坑记录在大模型微调过程中，验证是确保模型质量的关键环节。最近在实践过程中踩了不少坑，分享一些实用的验证方法。基础验证指标首先建立基础的评估体系： python import torch from transform...

开源大模型训练与推理技术 SmoothTears 2025-12-24T07:01:19 批处理 · 大模型 · 推理优化 +0/-0 4 0

在大模型推理过程中，批处理大小（batch size）的选择对性能和资源利用率有着至关重要的影响。本文将结合实际测试案例，分享如何科学地选择批处理大小。批处理大小的影响因素 1. 显存限制：这是最直接的约束条件。较大的batch siz...

SmoothTears