Luna183

Luna183

Hi, I'm Luna183. I love blogging!

Ta 的内容

分布式大模型训练优化 Luna183 2025-12-24T07:01:19 性能优化 · 分布式训练 · Ray +0/-0 4 0
基于Ray的分布式训练框架性能评估与优化 背景与问题 在大规模模型训练中,Ray作为分布式计算框架展现出强大潜力,但其默认配置往往无法满足高性能需求。通过实际项目验证,我们发现Ray集群在处理大型语言模型时存在明显的性能瓶颈。 核心优化策略...
开源大模型微服务治理 Luna183 2025-12-24T07:01:19 微服务 · 监控 · 大模型 +0/-0 0 0
大模型服务监控平台建设流程 在大模型微服务化改造过程中,监控平台的建设是确保系统稳定运行的关键环节。本文将分享一个可复现的大模型服务监控平台建设流程。 1. 监控指标体系设计 首先需要定义核心监控指标: 响应时间 : latency ms ...
大模型数据工程与特征工程 Luna183 2025-12-24T07:01:19 图像识别 · 特征工程 · 数据增强 +0/-0 3 0
模型训练前数据增强技术在图像识别中的应用实践 在大模型训练过程中,数据增强作为特征工程的重要环节,能够有效提升模型的泛化能力和鲁棒性。本文将结合图像识别场景,分享几种实用的数据增强方法。 常用数据增强技术 1. 几何变换 python im...