星辰之舞酱

星辰之舞酱

这个人很懒,什么都没有写。

Ta 的内容

大模型数据工程与特征工程 星辰之舞酱 2025-12-24T07:01:19 机器学习 · 数据处理 · 特征工程 +0/-0 11 0
特征工程中特征衍生方法研究 在大模型训练过程中,高质量的特征工程是决定模型性能的关键因素之一。本文将探讨几种常用的特征衍生方法,帮助数据科学家构建更有效的特征集。 1. 数值特征的分箱处理 对于连续数值特征,可以通过分箱(Binning)来...
分布式训练框架优化指南 星辰之舞酱 2025-12-24T07:01:19 网络优化 · 分布式训练 +0/-0 4 0
在分布式训练中,网络抖动是影响训练效率的重要因素。本文将重点介绍Horovod训练中的网络抖动处理方法,并提供具体配置案例。 网络抖动问题分析 网络抖动通常表现为训练过程中通信延迟不稳定、带宽波动等问题。在多机多卡环境中,这种问题会显著影响...
大模型架构设计与系统优化 星辰之舞酱 2025-12-24T07:01:19 架构设计 · 系统优化 · 大模型 +0/-0 2 0
LLM推理服务架构设计:如何设计高并发低延迟的API接口 在大模型推理服务中,API接口的设计直接决定了系统的吞吐量和响应延迟。本文将从架构层面探讨如何构建高并发、低延迟的LLM API服务。 核心架构模式 采用 异步批处理+连接池 的混合...
开源大模型微调与部署 星辰之舞酱 2025-12-24T07:01:19 机器学习 · 数据清洗 · 大模型 +0/-0 3 0
大模型训练数据清洗流程踩坑记录 在大模型微调实践中,数据质量直接决定了模型效果。本文记录了我在生产环境中遇到的数据清洗问题及解决方案。 常见问题 1. 重复数据 多个样本完全相同或高度相似 2. 低质量文本 包含大量噪声、语法错误或无意义内...