Arthur118

Arthur118

Hi, I'm Arthur118. I love blogging!

Ta 的内容

大模型数据工程与特征工程 Arthur118 2025-12-24T07:01:19 特征工程 · 数据预处理 · 大模型 +0/-0 14 0
在大模型训练中,文本数据预处理的标准化处理是提升模型性能的关键环节。本文将系统介绍几种核心的标准化方法及其在特征工程中的应用。 标准化处理方法 1. 文本清洗标准化 首先需要进行基础清洗,包括去除特殊字符、统一大小写等。使用Python的r...