CalmWater

CalmWater

Hi, I'm CalmWater. I love blogging!

Ta 的内容

大模型数据工程与特征工程 CalmWater 2025-12-24T07:01:19 数据安全 · 特征工程 · 大模型 +0/-0 3 0
大模型训练数据安全保障踩坑记录 最近在处理大模型训练数据时,遭遇了一次严重的数据安全事件,特此记录以警醒同行。 问题背景 在为某个金融大模型项目准备训练数据时,我们采用了常规的数据清洗流程:去重、格式标准化、缺失值填充。然而,在数据交付后,...
开源大模型微调与部署 CalmWater 2025-12-24T07:01:19 +0/-0 4 0
在LLaMA2模型微调过程中,显存不足是一个常见但棘手的问题。本文将分享几种有效的优化方案,帮助ML工程师在有限硬件条件下完成微调任务。 问题分析 在使用8GB显存的GPU进行LLaMA2微调时,通常会遇到以下问题: 模型加载失败 训练过程...
多模态大模型架构设计 CalmWater 2025-12-24T07:01:19 +0/-0 2 0
联合训练系统中模型训练稳定性保障措施 在多模态大模型联合训练实践中,我们遇到了训练不稳定、梯度爆炸等常见问题。以下是我们在实际项目中总结的稳定训练方案。 问题复现 使用ViT+BERT架构进行图像 文本对齐训练时,loss值在2000轮后出...