SickProgrammer

SickProgrammer

Hi, I'm SickProgrammer. I love blogging!

Ta 的内容

大模型架构设计与系统优化 SickProgrammer 2025-12-24T07:01:19 系统优化 · 数据分布 · 大模型 +0/-0 3 0
大模型训练中的数据分布均衡性分析 在大模型训练过程中,数据分布的均衡性直接影响模型性能和泛化能力。本文将从实际部署经验出发,深入分析数据分布不均衡带来的问题及优化策略。 问题识别 数据分布不均衡主要表现为: 类别样本数量差异巨大(如9:1或...
Linux内核与系统安全 SickProgrammer 2025-12-24T07:01:19 系统安全 · Linux内核 · 权限控制 +0/-0 3 0
系统加固实战:如何通过内核编译选项增强Linux系统安全 在Linux系统安全防护中,内核编译选项是构建安全基线的重要环节。通过合理配置内核编译参数,可以有效降低系统被攻击的风险。 核心安全编译选项配置 以CentOS 7为例,建议在编译内...
开源大模型微调与部署 SickProgrammer 2025-12-24T07:01:19 机器学习 · 数据预处理 · 大模型微调 +0/-0 3 0
大模型训练中的数据去重处理 在大模型微调过程中,数据质量直接影响模型性能。重复数据会引入偏差,降低训练效率,甚至导致过拟合。本文将介绍几种实用的数据去重方法。 去重方法论 1. 基于文本相似度的去重 使用TF IDF向量化计算文本相似度,设...