用户主页 - 极简博客

大模型数据工程与特征工程 Hannah781 2025-12-24T07:01:19 特征工程 · 数据清洗 · 异常检测 +0/-0 10 0

数据清洗中的异常检测方法对比在大模型训练数据处理中，异常值检测是特征工程的关键环节。最近在处理用户行为数据时遇到了一个典型问题：某些用户的点击率异常高，明显偏离正常分布。常见异常检测方法对比 1. Z Score方法（标准差法） pyt...

React Server组件实践 Hannah781 2025-12-24T07:01:19 性能测试 · React Server Components +0/-0 4 0

服务端渲染组件加载优化方案在React Server Component实践中，服务端渲染组件加载优化是提升应用性能的关键环节。本文将分享一套完整的优化方案。核心优化策略 1. 组件分割与懒加载 javascript // 使用Reac...

开源大模型微服务治理 Hannah781 2025-12-24T07:01:19 微服务 · 版本控制 · 大模型 +0/-0 3 0

在微服务架构中，大模型（LLM）的版本控制是一个关键挑战。本文将分享一种实用的版本管理方案。核心思路采用GitOps + Model Registry的组合方案来管理LLM模型版本。通过CI/CD流水线自动构建和注册模型版本。实施步骤...

TensorFlow Serving微服务架构实践 Hannah781 2025-12-24T07:01:19 Nginx · 负载均衡 · TensorFlow Serving +0/-0 3 0

Nginx反向代理TensorFlow Serving负载均衡配置在TensorFlow Serving微服务架构中，通过Nginx实现负载均衡是提升系统可用性和性能的关键步骤。本文将详细介绍如何配置Nginx作为反向代理来分发Tenso...

大模型数据工程与特征工程 Hannah781 2025-12-24T07:01:19 特征工程 · 数据清洗 · 数据质量 +0/-0 4 0

构建数据质量评估系统的经验分享在大模型训练过程中，数据质量问题往往导致模型性能下降甚至训练失败。本文分享一个实用的数据质量评估系统构建经验。核心问题我们遇到的典型问题包括：数据缺失值过多（超过30%）异常值干扰（如年龄为负数）重...

开源大模型微调与部署 Hannah781 2025-12-24T07:01:19 模型部署 · 大模型微调 +0/-0 3 0

在大模型微调过程中，早停机制（Early Stopping）是防止过拟合、优化训练效率的关键技术。本文将详细介绍如何在实际项目中设置早停机制。什么是早停机制早停机制通过监控验证集上的性能指标，在模型性能不再提升时自动停止训练。这能有效避...

LLM微调工程化实践 Hannah781 2025-12-24T07:01:19 资源管理 · LoRa · 微调 +0/-0 2 0

LoRA微调中的训练资源管理在大语言模型微调实践中，资源管理是影响训练效率和成本的关键因素。本文将围绕LoRA微调中的资源分配策略进行详细复盘。资源分配策略在LoRA微调中，我们采用分阶段资源分配： 1. 基础资源配置：使用8卡A1...

大模型架构设计与系统优化 Hannah781 2025-12-24T07:01:19 可扩展性 · 分布式部署 · 大模型 +0/-0 3 0

在大模型架构设计中，可扩展性是决定系统长期稳定运行的核心因素。本文将从实际部署经验出发，对比单机与分布式部署的可扩展性特点，并提供可复现的评估方法。单机部署的局限性单机部署虽然部署简单，但在面对大模型时存在明显瓶颈。以Llama2 70...

分布式大模型训练优化 Hannah781 2025-12-24T07:01:19 分布式训练 +0/-0 4 0

深度学习训练中模型泛化能力提升技巧最近在做大规模分布式训练时，发现模型过拟合问题特别严重，经过多次踩坑总结出几个实用技巧。 1. 学习率调度器优化使用余弦退火+Warmup策略，避免直接用固定学习率。 python from torch...

PyTorch深度学习模型优化实战 Hannah781 2025-12-24T07:01:19 PyTorch · 模型部署 · 推理优化 +0/-0 4 0

推理加速对比：PyTorch vs TensorFlow Lite vs ONNX Runtime 实验环境 Python 3.9 PyTorch 2.0 TensorFlow Lite 2.13 ONNX Runtime 1.15 测试模...

Hannah781