用户主页 - 极简博客

大模型数据工程与特征工程 Trudy822 2025-12-24T07:01:19 数据预处理 +0/-0 8 0

文本数据编码格式转换最佳实践在大模型训练过程中，文本数据的编码格式转换是数据预处理的关键环节。本文分享几个踩坑经验与实用技巧。常见问题我曾经在处理中文文本时，遇到编码不一致导致的乱码问题。原始数据是gbk编码，但模型训练需要utf 8...

分布式训练框架优化指南 Trudy822 2025-12-24T07:01:19 性能优化 · 分布式训练 +0/-0 4 0

分布式训练中的梯度聚合优化方法在多机多卡分布式训练中，梯度聚合是影响训练性能的关键环节。本文将深入探讨几种有效的梯度聚合优化策略。 1. 梯度压缩与量化通过梯度压缩可以显著减少通信带宽消耗。使用Horovod时，可以通过设置 compr...

分布式大模型训练优化 Trudy822 2025-12-24T07:01:19 负载均衡 · 分布式训练 +0/-0 4 0

在大规模模型训练中，模型切分与负载均衡是决定训练效率的关键因素。本文将通过对比不同切分策略和负载均衡方案，分享实际调优经验。模型切分策略对比 1. 层级切分 vs 参数级切分层级切分：以神经网络层为单位进行切分，适合模型结构相对固定的场...

开源大模型安全与隐私保护 Trudy822 2025-12-24T07:01:19 隐私保护 · 安全测试 +0/-0 2 0

大模型输出质量与安全性平衡策略在大模型应用开发中，确保输出质量和安全性的平衡是核心挑战。本文将分享一套实用的平衡策略和测试方法。核心策略框架 1. 输入验证层：在模型处理前对输入进行安全检查 2. 输出过滤层：实时监控和过滤不安全内...

Linux内核与系统安全 Trudy822 2025-12-24T07:01:19 系统安全 · Linux内核 · systemd +0/-0 2 0

系统安全测试：使用systemd分析Linux内核服务安全在Linux系统安全防护中，systemd作为现代Linux发行版的默认初始化系统，其配置直接关系到系统服务的安全性。本文将通过具体案例演示如何使用systemd分析和加固内核服务...

Linux内核与系统安全 Trudy822 2025-12-24T07:01:19 系统安全 · 漏洞修复 · Linux内核 +0/-0 4 0

CVE 2023 98765漏洞分析与系统加固方案漏洞概述 CVE 2023 98765是一个影响Linux内核的权限提升漏洞，主要存在于内核的内存管理子系统中。该漏洞允许本地攻击者通过特定的内存操作获得root权限。环境验证 bash...

Linux内核与系统安全 Trudy822 2025-12-24T07:01:19 +0/-0 4 0

Linux内核安全调优：如何优化sysctl参数提升系统抗攻击能力在Linux系统安全防护中，内核参数调优是构建安全基线的重要环节。通过合理配置sysctl参数，可以有效增强系统对常见攻击的抵御能力。核心安全参数配置 1. 禁用IP转发...

分布式训练框架优化指南 Trudy822 2025-12-24T07:01:19 分布式训练 +0/-0 4 0

在分布式训练中，GPU显存溢出是常见问题，尤其在多机多卡环境下。本文将通过实际案例展示如何优化Horovod和PyTorch Distributed配置来解决此问题。问题场景：当使用Horovod进行分布式训练时，单个GPU显存不足导致...

LLM微调工程化实践 Trudy822 2025-12-24T07:01:19 LoRa · 微调 · Adapter +0/-0 4 0

架构设计原则：构建可维护性强的LoRA微调系统在大语言模型微调工程化实践中，LoRA（Low Rank Adaptation）技术因其高效性和可复用性，已成为主流方案。本文将从架构层面探讨如何构建一个可维护性强的LoRA微调系统。核心架...

PyTorch深度学习模型优化实战 Trudy822 2025-12-24T07:01:19 PyTorch · ONNX · TensorRT +0/-0 3 0

在深度学习模型部署中，从PyTorch到ONNX再到TensorRT的优化路径是提升推理性能的关键环节。本文将通过具体代码示例和性能测试数据展示不同阶段的优化效果。首先，我们以一个简单的ResNet 18模型为例，演示如何将其导出为ONN...

Trudy822