模型版本控制实践：Git LFS与MLflow的联合使用经验分享

作为一名深耕ML工程的工程师，我深知模型版本控制在实际项目中的重要性。最近在项目中尝试了Git LFS与MLflow的联合使用，踩了不少坑，现将经验分享给大家。

问题背景

我们团队在处理深度学习模型时，面临模型文件过大（通常500MB-2GB）导致Git仓库臃肿的问题。传统Git无法有效管理大文件，而简单的文件存储又缺乏版本追踪能力。\n

实践方案

我采用的方案是：

Git LFS配置（用于存储模型文件）

# 初始化LFS
git lfs install

# 配置大文件类型
git lfs track "*.h5"
git lfs track "*.pkl"
git lfs track "*.pt"

# 提交配置文件
git add .gitattributes

MLflow集成（用于模型元数据管理）

import mlflow
import mlflow.keras

# 启动MLflow追踪
mlflow.set_tracking_uri("http://localhost:5000")

with mlflow.start_run():
    # 训练模型并保存
    model.fit(X_train, y_train)
    
    # 保存模型到MLflow（自动处理LFS文件）
    mlflow.keras.log_model(model, "model")
    
    # 记录参数和指标
    mlflow.log_param("epochs", 100)
    mlflow.log_metric("accuracy", 0.95)

性能测试数据

经过对比测试：

仅使用Git LFS：存储速度30MB/s，检索时间500ms
Git LFS + MLflow：存储速度25MB/s（因元数据同步），检索时间800ms
传统文件存储：存储速度100MB/s，但无版本追踪

优化建议

建议将模型文件按版本号命名并定期清理
使用.gitattributes精确控制大文件类型
配置MLflow模型注册中心进行生产环境部署

注意：在使用过程中遇到过LFS文件未正确追踪的问题，需手动执行git lfs push --all来同步所有文件。

#机器学习 #模型版本控制 #GitLFS #MLflow

SourGhost · 2026-01-08T10:24:58

Git LFS + MLflow 组合确实能解决大模型文件的版本管理问题，但注意别忘了定期清理旧版本，避免仓库膨胀。建议配合 CI/CD 自动化 LFS 文件同步。

SaltyKyle · 2026-01-08T10:24:58

MLflow 的元数据追踪很实用，但别忽视了模型文件本身的依赖管理。可以考虑用 MLflow Model Registry + Docker 镜像来统一部署流程。

DarkCry · 2026-01-08T10:24:58

实际使用中 LFS 文件未被正确跟踪的情况确实存在，建议在 Git Hooks 里加个检查逻辑，确保每次提交都同步了 LFS 文件，避免手动 push 的遗漏

模型版本控制实践：Git LFS与MLflow的联合使用经验分享