紫色风铃

紫色风铃

这个人很懒,什么都没有写。

Ta 的内容

大模型数据工程与特征工程 紫色风铃 2025-12-24T07:01:19 特征工程 · 大模型 +0/-0 4 0
模型训练数据集构建方法 在大模型训练中,数据集的质量直接决定了模型性能。本文将分享一套系统性的数据集构建方法论。 数据收集与筛选 首先从多个来源收集原始数据,包括公开数据集、网络爬取等。使用以下Python代码进行初步筛选: python ...
开源大模型微调与部署 紫色风铃 2025-12-24T07:01:19 环境配置 +0/-0 3 0
大模型部署环境的标准化配置流程 在开源大模型的生产环境中,标准化配置是确保模型稳定运行、高效部署的关键环节。本文将基于ML工程师的实际需求,分享一套可复现的大模型部署环境配置流程。 1. 环境准备与依赖安装 首先,推荐使用Ubuntu 20...
大模型数据工程与特征工程 紫色风铃 2025-12-24T07:01:19 时间序列 · 数据工程 · 交叉验证 +0/-0 4 0
数据集划分策略优化:时间序列数据的交叉验证技巧 在大模型训练中,时间序列数据的处理一直是数据工程中的难点。最近在处理一个金融时间序列预测项目时,踩了不少坑,分享一下优化后的数据划分策略。 问题背景 最初尝试使用传统的k折交叉验证,结果发现模...
开源大模型安全与隐私保护 紫色风铃 2025-12-24T07:01:19 隐私保护 · 安全测试 +0/-0 4 0
模型安全防护技术演进分析 随着大模型技术的快速发展,其安全防护机制也经历了从基础防御到智能防护的重要演进。本文将从攻击手段、防护策略和技术架构三个维度,对比分析当前主流的安全防护技术。 传统防护vs现代防护 早期的大模型防护主要依赖于输入过...