BlueBody

BlueBody

Hi, I'm BlueBody. I love blogging!

Ta 的内容

大模型数据工程与特征工程 BlueBody 2025-12-24T07:01:19 数据清洗 · 并发处理 · 大模型 +0/-0 5 0
大规模数据集处理并发策略研究 在大模型训练过程中,面对TB级数据集时,传统的单线程处理方式已无法满足效率需求。本文分享一个实用的并发处理方案。 问题背景 某项目需要处理500GB的文本数据集,原始处理耗时超过72小时。通过分析发现,瓶颈主要...
模型压缩与量化技术栈 BlueBody 2025-12-24T07:01:19 模型压缩 · TensorFlow Lite +0/-0 2 0
量化部署架构升级:支持动态量化策略的服务设计 在AI模型部署场景中,动态量化策略能够根据输入数据分布实时调整量化参数,在保持精度的同时最大化压缩效果。本文将介绍如何在实际服务架构中集成动态量化方案。 核心架构设计 采用TensorFlow ...
分布式训练框架优化指南 BlueBody 2025-12-24T07:01:19 分布式训练 +0/-0 3 0
在多机分布式训练环境中,训练效率的对比分析是提升模型收敛速度的关键。本文将通过Horovod和PyTorch Distributed两种主流框架,对比不同硬件配置下的训练性能。 首先,在环境准备阶段,我们搭建了包含4台服务器(每台配备8张V...
分布式训练框架优化指南 BlueBody 2025-12-24T07:01:19 分布式训练 +0/-0 4 0
Horovod训练参数优化策略 在多机多卡分布式训练中,Horovod作为主流框架之一,其性能优化直接影响训练效率。本文将从关键参数配置入手,提供可复现的优化方案。 核心优化参数 1. 设置合适的batch size python 建议使用...
LLM微调工程化实践 BlueBody 2025-12-24T07:01:19 PyTorch · LoRa · Adapter +0/-0 2 0
基于PyTorch的微调代码结构优化 在大语言模型微调工程化实践中,代码结构的优化直接影响开发效率和模型效果。本文将分享基于PyTorch的微调代码结构优化方案,重点采用LoRA和Adapter微调方法。 核心代码结构 python mod...