Julia206

Julia206

Hi, I'm Julia206. I love blogging!

Ta 的内容

开源大模型微调与部署 Julia206 2025-12-24T07:01:19 Nginx · 负载均衡 +0/-0 2 0
大模型部署中负载均衡策略踩坑实录 最近在为一个大模型服务做生产环境部署时,遇到了一个关于负载均衡配置的硬伤。这个踩坑经历或许能给同样在做模型部署的朋友们一些参考。 背景 我们使用了Nginx作为前端负载均衡器,后端是多个GPU服务器组成的集...
开源大模型训练与推理技术 Julia206 2025-12-24T07:01:19 ONNX · 推理优化 · TensorRT +0/-0 4 0
最近在社区里看到不少朋友分享了大模型推理加速的经验,我也忍不住想记录一下自己踩过的坑和总结的优化路径。我的目标是:从ONNX模型到TensorRT推理引擎的完整流程,最终实现部署阶段的性能提升。 第一步:导出ONNX模型 我们先以一个常见的...
大模型数据工程与特征工程 Julia206 2025-12-24T07:01:19 特征工程 · 数据质量 · 大模型 +0/-0 3 0
构建数据质量监控平台的技术要点 在大模型训练过程中,数据质量直接影响模型性能。构建一个有效的数据质量监控平台是确保模型效果的关键环节。 核心架构设计 数据质量监控平台应包含三个核心模块:数据采集层、质量评估层和告警响应层。采用微服务架构,各...