用户主页 - 极简博客

大模型数据工程与特征工程 Diana732 2025-12-24T07:01:19 特征工程 · 数据清洗 · 大模型 +0/-0 9 0

在大模型训练过程中，数据清洗效率直接影响模型训练效果和时间成本。本文分享几种提升数据清洗效率的实用策略。 1. 并行化数据清洗管道使用Dask或Ray框架实现并行数据处理，将数据分块并行清洗。例如： python import dask....

多模态大模型架构设计 Diana732 2025-12-24T07:01:19 模型训练 +0/-0 3 0

多模态模型训练中的梯度累积在多模态大模型训练中，梯度累积是优化计算资源、提升训练效率的关键技术。当单个batch size受限于显存时，我们可以通过梯度累积来模拟更大的batch size。核心原理假设GPU显存限制只能处理batch...

开源大模型测试与质量保障 Diana732 2025-12-24T07:01:19 自动化测试 · 开源框架 +0/-0 4 0

开源大模型测试框架搭建经验在开源大模型测试领域，构建一个高效、可靠的测试框架是保障模型质量的关键。本文将从实际操作角度出发，分享一套可复现的测试框架搭建方案。测试框架选型我们选择基于Python的pytest作为主测试框架，配合uni...

大模型数据工程与特征工程 Diana732 2025-12-24T07:01:19 特征工程 · 数据清洗 +0/-0 2 0

特征提取中的数据去重策略在大模型训练过程中，数据去重是特征工程中不可忽视的重要环节。最近在处理一个大规模文本数据集时，我踩了一个典型的坑——简单使用哈希去重导致了严重的数据偏差。问题复现最初我采用了最简单的方案： python imp...

分布式大模型训练优化 Diana732 2025-12-24T07:01:19 分布式训练 +0/-0 2 0

分布式训练中训练稳定性调优经验最近在进行大规模分布式训练时遇到了严重的训练不稳定问题，记录一下踩坑过程和解决方案。问题现象使用PyTorch Lightning + DeepSpeed进行16卡训练时，训练到第5000步后出现梯度爆炸...

大模型安全防护体系 Diana732 2025-12-24T07:01:19 安全防护 · 内容过滤 · 大模型 +0/-0 2 0

大模型推理过程中的输出内容过滤实验实验背景在大模型推理过程中，输出内容的安全性直接关系到系统安全性。本文通过构建过滤机制，对模型输出进行实时内容检测和过滤。实验设计我们采用以下过滤策略： 1. 关键词过滤：构建敏感词库，包括恶意代...

模型压缩与量化技术栈 Diana732 2025-12-24T07:01:19 模型压缩 +0/-0 2 0

量化调优案例：在移动端部署的量化模型性能优化在移动端部署AI模型时，量化技术是提升推理速度和降低功耗的关键手段。本文通过实际案例演示如何对ResNet50模型进行量化优化。环境准备 bash pip install torch torc...

开源大模型安全与隐私保护 Diana732 2025-12-24T07:01:19 Transformer · 安全测试 · 模型压缩 +0/-0 2 0

基于Transformer的模型压缩技术踩坑记录在大模型时代，Transformer架构的广泛应用带来了计算资源消耗巨大的挑战。本文分享在实践过程中遇到的几个关键问题及解决方案。问题一：量化压缩导致精度下降使用TensorFlow M...

LLM服务中API限流策略研究

开源大模型微调与部署 Diana732 2025-12-24T07:01:19 生产环境 · LLM +0/-0 4 0

在LLM服务中，API限流是保障系统稳定性和公平性的关键策略。本文将介绍几种常用的限流方法，并提供可复现的实现方案。限流策略概述常见的限流策略包括： 1. 令牌桶算法：允许突发流量但平均速率限制 2. 漏桶算法：平滑请求速率，适合处...

GPU硬件资源利用率分析

分布式训练框架优化指南 Diana732 2025-12-24T07:01:19 分布式训练 +0/-0 2 0

GPU硬件资源利用率分析在分布式训练中，GPU硬件资源利用率是影响训练效率的关键因素。本文将通过实际案例对比不同配置下的GPU利用率表现。环境配置 4台服务器，每台2张V100 GPU PyTorch 1.9 + CUDA 11.2 数...

Diana732