用户主页 - 极简博客

大模型数据工程与特征工程 Arthur118 2025-12-24T07:01:19 特征工程 · 数据预处理 · 大模型 +0/-0 14 0

在大模型训练中，文本数据预处理的标准化处理是提升模型性能的关键环节。本文将系统介绍几种核心的标准化方法及其在特征工程中的应用。标准化处理方法 1. 文本清洗标准化首先需要进行基础清洗，包括去除特殊字符、统一大小写等。使用Python的r...

Linux内核与系统安全 Arthur118 2025-12-24T07:01:19 日志分析 · 系统安全 +0/-0 4 0

系统安全审计实践：Linux日志分析工具syslog ng配置方法在Linux系统安全审计中，日志分析是关键环节。syslog ng作为企业级日志收集和处理工具，在系统安全监控中发挥重要作用。基础配置示例首先配置基础的日志接收服务： ...

开源大模型测试与质量保障 Arthur118 2025-12-24T07:01:19 测试工具 · 质量保障 +0/-0 2 0

开源大模型测试工具使用技巧在开源大模型测试领域，选择合适的工具是保障测试质量的关键。本文将对比分析几款主流测试工具的使用技巧。工具对比：LLM Test Suite vs LLM Evaluation LLM Test Suite 作为...

大模型数据工程与特征工程 Arthur118 2025-12-24T07:01:19 特征工程 · 时间序列 · 大模型 +0/-0 3 0

时间序列特征工程实战指南在大模型训练中，时间序列数据的特征工程是决定模型性能的关键环节。本文将分享几个实用的时间序列建模技巧。 1. 滞后特征构造滞后特征是时间序列分析的基础，能够捕捉数据的时序依赖性： python import pa...

数据预处理性能优化技巧

大模型数据工程与特征工程 Arthur118 2025-12-24T07:01:19 性能优化 · 特征工程 · 数据预处理 +0/-0 3 0

数据预处理性能优化技巧在大模型训练中，数据预处理阶段的效率直接影响整体训练速度。本文分享几种实用的性能优化技巧。 1. 批处理与并行化使用 pandas 的 chunksize 参数进行分批处理，避免内存溢出： python impor...

开源大模型微调与部署 Arthur118 2025-12-24T07:01:19 Transformer · 微调 +0/-0 2 0

Transformer微调时过拟合问题解决方案记录在开源大模型微调过程中，过拟合是一个常见但棘手的问题。本文记录了在实际项目中遇到的过拟合现象及相应的解决方案。问题现象在使用Llama2 7B模型进行下游任务微调时，训练集上的loss...

Linux内核与系统安全 Arthur118 2025-12-24T07:01:19 Linux内核 · 安全配置 · 权限控制 +0/-0 2 0

安全运维案例：CentOS中Linux内核模块加载控制实践在Linux系统安全防护体系中，内核模块的加载控制是防止恶意代码注入的重要环节。本文将通过具体案例，介绍如何在CentOS系统中实施内核模块加载的安全策略。背景问题在一次安全审...

Linux内核与系统安全 Arthur118 2025-12-24T07:01:19 漏洞修复 · Linux内核 +0/-0 2 0

CVE 2023 43210 是一个影响 Linux 内核的权限提升漏洞，主要存在于内核的 net/ipv4/tcp input.c 文件中，攻击者可利用该漏洞在特定条件下实现本地提权。本文基于实际修复经验，提供详细处理方案。漏洞分析该...

模型压缩与量化技术栈 Arthur118 2025-12-24T07:01:19 模型压缩 · TensorRT +0/-0 3 0

量化压缩算法对比：不同压缩比下的精度损失分析在模型部署实践中，量化是实现模型轻量化的关键手段。本文通过实验对比了多种量化方法在不同压缩比下的精度表现。实验环境模型：ResNet50 数据集：ImageNet (1000类) 工具：Py...

TensorFlow Serving微服务架构实践 Arthur118 2025-12-24T07:01:19 TensorFlow · Kubernetes · loadbalancing · Serving +0/-0 4 0

多集群TensorFlow服务统一管理方案在大规模机器学习模型部署场景中，多集群TensorFlow服务统一管理成为关键挑战。本文将介绍基于Kubernetes的多集群统一管理架构。核心架构设计采用Helm Chart进行容器化部署，...

Arthur118