Kubernetes原生AI应用部署新趋势：Kubeflow 1.8最新特性深度解析与实战应用

引言：迈向云原生AI的新纪元

随着人工智能（AI）技术在企业级应用中的快速普及，传统AI开发模式正面临前所未有的挑战。从模型训练的资源管理到推理服务的弹性伸缩，再到整个机器学习生命周期（ML Lifecycle）的可重复性与可观测性，传统的本地化、孤岛式AI工作流已难以满足现代企业对敏捷性、可扩展性和标准化的需求。

在此背景下，“云原生AI”成为行业共识——将AI系统构建在容器化、编排自动化、微服务架构的基础上，借助Kubernetes这一主流容器编排平台实现统一调度与治理。而 Kubeflow 正是这一理念的核心实践者。作为由Google发起并由社区共建的开源项目，Kubeflow致力于在Kubernetes上打造一个端到端的MLOps（Machine Learning Operations）平台，让数据科学家、工程师和运维人员能够协同高效地构建、部署和管理AI应用。

2024年发布的 Kubeflow 1.8 版本，标志着其向“生产就绪型AI平台”的进一步迈进。该版本不仅强化了核心功能模块的稳定性与性能表现，更引入了一系列关键创新特性，涵盖模型训练优化、推理服务增强、自动化流水线支持以及与主流AI框架的深度集成。这些变化使得Kubeflow不再只是一个实验性工具，而是真正具备企业级落地能力的AI基础设施。

本文将深入剖析Kubeflow 1.8的核心新特性，结合真实场景案例，提供完整的部署指南与代码示例，帮助读者掌握如何基于Kubernetes构建高性能、高可用、可复用的AI应用体系。无论你是AI开发者、DevOps工程师还是平台架构师，都能从中获得实用的技术洞见与最佳实践建议。

Kubeflow 1.8 核心新特性概览

Kubeflow 1.8 在前代版本基础上进行了全面升级，重点聚焦于可扩展性、自动化程度、易用性与生产可靠性四大维度。以下是本次发布中最具影响力的几项关键更新：

1. 基于Kueue的资源调度器增强（Resource Scheduling with Kueue）

Kubeflow 1.8 引入了对 Kueue 的原生支持，这是Kubernetes社区推出的先进多租户资源调度框架。Kueue允许集群管理员定义资源配额策略，并通过队列机制控制不同团队或项目的作业优先级与资源分配。

✅ 支持细粒度的CPU/GPU/内存资源配额管理
✅ 实现公平共享与抢占机制（Preemption）
✅ 集成至Kubeflow Pipelines，自动排队等待资源
✅ 降低资源争用导致的任务失败率

示例：某金融公司有多个AI团队同时运行大规模训练任务，使用Kueue后可设定“风控模型组”优先级高于“推荐系统组”，确保关键业务模型按时完成。

2. 自动化MLOps流水线（Pipeline-as-Code with Argo Workflows + Tekton）

Kubeflow 1.8 对其流水线引擎进行了重构，采用 Argo Workflows 作为默认执行引擎，并新增对 Tekton 的兼容支持。这带来了更强的声明式配置能力与CI/CD集成能力。

✅ 支持YAML格式定义完整ML流水线（数据预处理 → 训练 → 评估 → 注册 → 部署）
✅ 支持GitOps模式，流水线配置纳入版本控制
✅ 内建可视化仪表盘，实时追踪流水线状态
✅ 支持参数化输入与动态变量注入

3. 模型服务化新范式：KFServing 与 Triton Inference Server 集成

Kubeflow 1.8 提升了对 Triton Inference Server 的原生支持，替代旧版KFServing的部分功能，带来更高的推理吞吐量与更低延迟。

✅ 支持ONNX、TensorFlow、PyTorch等多框架模型
✅ 动态批处理（Dynamic Batching）与并发请求优化
✅ 支持模型版本管理与A/B测试
✅ 自动扩缩容（HPA + VPA）结合Prometheus监控

4. 新增模型注册中心（Model Registry）与元数据管理

Kubeflow 1.8 集成了 ML Metadata (MLMD) 与 Seldon Core 的元数据链路，构建起完整的模型生命周期追踪能力。

✅ 自动记录模型训练日志、超参、指标、数据集版本
✅ 支持模型版本对比与回归分析
✅ 可视化模型依赖图谱与变更历史
✅ 与外部系统（如Data Catalog、Airflow）打通

5. 安全增强与RBAC权限控制完善

为适应企业安全合规要求，Kubeflow 1.8 增强了身份认证与授权机制：

✅ 支持OAuth2 / OIDC 登录（如Keycloak、Auth0）
✅ 基于RBAC的细粒度权限控制（Project/Team/Model级别）
✅ 服务账户Token自动轮换
✅ 容器镜像签名验证（Cosign + Sigstore）

Kubeflow 1.8 架构演进与组件关系图解

为了更好地理解Kubeflow 1.8的内部运作机制，我们首先来看一张简化但关键的架构图：

graph TD
    A[用户界面] -->|Web UI / CLI| B(Kubeflow Dashboard)
    B --> C[Central API Server]
    C --> D[Kubeflow Pipelines]
    C --> E[KF Serving (Triton)]
    C --> F[Meta Controller & MLMD]
    C --> G[User Management & Auth]

    D --> H[Argo Workflows]
    D --> I[GitOps (Flux/Kustomize)]
    D --> J[Custom Components]

    E --> K[Triton Inference Server]
    E --> L[HPA/VPA + Prometheus]

    F --> M[ML Metadata Store (PostgreSQL)]
    F --> N[Artifact Store (S3/GCS)]

    H --> O[Pods on Kubernetes Cluster]
    K --> O
    M --> O
    N --> O

关键组件说明：

组件	功能
Kubeflow Dashboard	提供统一UI入口，用于管理流水线、模型、命名空间等
Kubeflow Pipelines	流水线编排引擎，基于Argo Workflows实现
Triton Inference Server	推理服务引擎，支持多种框架和动态批处理
ML Metadata (MLMD)	跟踪模型训练过程中的所有元数据
Artifact Store	存储模型、数据集、日志等二进制资产（S3/GCS）
Kueue	多租户资源调度，保障公平与优先级
Argo Workflows	流水线执行引擎，支持复杂DAG逻辑

⚠️ 注意：Kubeflow 1.8 已移除对旧版KFServing的默认支持，建议直接使用Triton作为推理后端。

实战部署：Kubeflow 1.8 在Kubernetes集群上的安装

接下来我们将以 minikube 为例，演示如何在本地环境快速搭建Kubeflow 1.8。此流程适用于开发与测试环境，生产环境请参考官方文档进行高可用部署。

1. 准备环境

确保你已安装以下工具：

# 检查版本
kubectl version --short
helm version --short
kustomize version
git --version

推荐使用 kubectl v1.27+ 和 Helm v3.11+

2. 安装 Kubeflow 1.8

使用官方提供的 kfctl 工具或 Helm Chart 进行部署。这里推荐使用 Helm 方式，更灵活可控。

步骤一：添加 Helm 仓库

helm repo add kubeflow https://charts.kubeflow.org
helm repo update

步骤二：创建命名空间

kubectl create namespace kubeflow

步骤三：部署 Kubeflow 核心组件（使用 Helm）

helm install kubeflow kubeflow/kubeflow --namespace kubeflow \
  --set istio.enabled=false \
  --set kubeflow_pipelines.enabled=true \
  --set kubeflow_pipelines.argo.enabled=true \
  --set kubeflow_pipelines.argo.workflow-controller.replicas=2 \
  --set kubeflow_pipelines.argo.ui.enabled=true \
  --set kubeflow_pipelines.metadata.mysql.enabled=true \
  --set kubeflow_pipelines.metadata.mysql.replicaCount=1 \
  --set kubeflow_pipelines.metadata.mysql.persistence.enabled=true \
  --set kubeflow_pipelines.metadata.mysql.persistence.size=1Gi \
  --set kubeflow_pipelines.metadata.mysql.auth.rootPassword="kubeflow123" \
  --set kubeflow_pipelines.metadata.mysql.auth.password="kubeflow123" \
  --set kubeflow_pipelines.metadata.mysql.auth.database="metadata_db" \
  --set kubeflow_pipelines.metadata.mysql.resources.requests.memory="512Mi" \
  --set kubeflow_pipelines.metadata.mysql.resources.requests.cpu="250m"

📌 说明：

istio.enabled=false：避免在简单环境中引入复杂服务网格

启用MySQL作为MLMD后端存储

设置合理的资源请求以防止Pod频繁重启

步骤四：等待组件就绪

kubectl get pods -n kubeflow -w

预计需要5~10分钟，所有Pod进入 Running 状态后即可访问。

步骤五：暴露Dashboard

kubectl port-forward svc/kubeflow-dashboard -n kubeflow 8080:80

打开浏览器访问：http://localhost:8080

首次登录可能需要配置用户名密码（若启用认证），或跳过（仅限测试）。

构建首个AI流水线：从数据到模型部署

现在我们来实战一个完整的端到端AI应用流程：使用Kubeflow Pipelines训练一个图像分类模型，并将其部署为在线推理服务。

场景描述

使用MNIST数据集训练CNN模型
使用PyTorch实现
流水线包含：数据准备 → 模型训练 → 模型评估 → 模型注册 → 推理服务部署

1. 准备项目结构

mkdir mnist-pipeline && cd mnist-pipeline
tree -a

输出如下：

mnist-pipeline/
├── pipeline.yaml
├── components/
│   ├── prepare_data.py
│   ├── train_model.py
│   ├── evaluate_model.py
│   └── deploy_serving.py
├── data/
│   └── mnist/
└── models/
    └── model.pth

2. 定义组件（Component Definition）

每个组件是一个独立的Python脚本，封装具体功能。使用 kfp.components 定义接口。

`components/prepare_data.py`

import os
import torch
from torchvision import datasets, transforms

def prepare_data(data_dir: str):
    print("Preparing MNIST dataset...")
    
    transform = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.1307,), (0.3081,))
    ])
    
    train_dataset = datasets.MNIST(
        root=data_dir,
        train=True,
        download=True,
        transform=transform
    )
    
    test_dataset = datasets.MNIST(
        root=data_dir,
        train=False,
        download=True,
        transform=transform
    )
    
    # Save to disk
    train_path = os.path.join(data_dir, "train.pt")
    test_path = os.path.join(data_dir, "test.pt")
    
    torch.save(train_dataset, train_path)
    torch.save(test_dataset, test_path)
    
    print(f"Data saved to {data_dir}")

📌 注意：此函数需打包为Docker镜像，后续在Kubeflow中运行。

`components/train_model.py`

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, 3, 1)
        self.conv2 = nn.Conv2d(32, 64, 3, 1)
        self.dropout1 = nn.Dropout2d(0.25)
        self.dropout2 = nn.Dropout2d(0.5)
        self.fc1 = nn.Linear(9216, 128)
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = self.conv1(x)
        x = nn.functional.relu(x)
        x = self.conv2(x)
        x = nn.functional.relu(x)
        x = nn.functional.max_pool2d(x, 2)
        x = self.dropout1(x)
        x = torch.flatten(x, 1)
        x = self.fc1(x)
        x = nn.functional.relu(x)
        x = self.dropout2(x)
        x = self.fc2(x)
        return nn.functional.log_softmax(x, dim=1)

def train_model(data_dir: str, model_path: str, epochs: int = 10):
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    
    # Load data
    train_dataset = torch.load(os.path.join(data_dir, "train.pt"))
    train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
    
    model = Net().to(device)
    optimizer = optim.Adadelta(model.parameters(), lr=1.0)
    scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=1, gamma=0.7)
    
    criterion = nn.NLLLoss()
    
    for epoch in range(epochs):
        model.train()
        for batch_idx, (data, target) in enumerate(train_loader):
            data, target = data.to(device), target.to(device)
            optimizer.zero_grad()
            output = model(data)
            loss = criterion(output, target)
            loss.backward()
            optimizer.step()
        
        scheduler.step()
        print(f"Epoch {epoch+1}/{epochs}, Loss: {loss.item():.4f}")
    
    # Save model
    torch.save(model.state_dict(), model_path)
    print(f"Model saved to {model_path}")

`components/evaluate_model.py`

import torch
import torch.nn as nn
from torch.utils.data import DataLoader

def evaluate_model(data_dir: str, model_path: str):
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    
    test_dataset = torch.load(os.path.join(data_dir, "test.pt"))
    test_loader = DataLoader(test_dataset, batch_size=1000, shuffle=False)
    
    model = Net().to(device)
    model.load_state_dict(torch.load(model_path))
    model.eval()
    
    correct = 0
    total = 0
    
    with torch.no_grad():
        for data, target in test_loader:
            data, target = data.to(device), target.to(device)
            output = model(data)
            pred = output.argmax(dim=1)
            correct += pred.eq(target).sum().item()
            total += target.size(0)
    
    accuracy = 100. * correct / total
    print(f"Test Accuracy: {accuracy:.2f}%")
    
    return {"accuracy": accuracy}

`components/deploy_serving.py`

import json
import subprocess
import os

def deploy_serving(model_path: str, service_name: str = "mnist-classifier"):
    # Step 1: Build Docker image
    dockerfile_content = f"""
FROM pytorch/pytorch:latest
COPY {model_path} /app/model.pth
EXPOSE 8080
CMD ["python", "-m", "seldon_core.microservice", "--service-name={service_name}", "--model-name=MnistModel"]
"""
    
    with open("Dockerfile", "w") as f:
        f.write(dockerfile_content)
    
    # Build image
    subprocess.run(["docker", "build", "-t", f"{service_name}:latest", "."], check=True)
    
    # Push to registry (example: Docker Hub)
    # Replace with your own registry
    subprocess.run(["docker", "push", f"{service_name}:latest"], check=True)
    
    # Deploy via Seldon Core CRD
    seldon_cr = {
        "apiVersion": "machinelearning.seldon.io/v1",
        "kind": "SeldonDeployment",
        "metadata": {"name": service_name},
        "spec": {
            "name": service_name,
            "predictors": [{
                "name": "default",
                "replicas": 1,
                "componentSpecs": [{
                    "spec": {
                        "containers": [{
                            "image": f"{service_name}:latest",
                            "name": "classifier"
                        }]
                    }
                }],
                "annotations": {
                    "prometheus.io/scrape": "true",
                    "prometheus.io/port": "8000"
                }
            }]
        }
    }
    
    with open("seldon-deployment.yaml", "w") as f:
        json.dump(seldon_cr, f, indent=2)
    
    # Apply CRD
    subprocess.run(["kubectl", "apply", "-f", "seldon-deployment.yaml"], check=True)
    
    print(f"SeldonDeployment '{service_name}' created.")

3. 定义流水线（pipeline.yaml）

apiVersion: argoproj.io/v1alpha1
kind: Workflow
metadata:
  name: mnist-training-pipeline
  namespace: kubeflow
spec:
  entrypoint: mnist-pipeline
  arguments:
    parameters:
      - name: epochs
        value: "10"

  templates:
    - name: mnist-pipeline
      steps:
        - - name: prepare-data
            template: prepare-data
            arguments:
              parameters:
                - name: data_dir
                  value: "/data/mnist"

        - - name: train-model
            template: train-model
            arguments:
              parameters:
                - name: data_dir
                  value: "/data/mnist"
                - name: model_path
                  value: "/models/model.pth"
                - name: epochs
                  value: "{{workflow.parameters.epochs}}"

        - - name: evaluate-model
            template: evaluate-model
            arguments:
              parameters:
                - name: data_dir
                  value: "/data/mnist"
                - name: model_path
                  value: "/models/model.pth"

        - - name: deploy-serving
            template: deploy-serving
            arguments:
              parameters:
                - name: model_path
                  value: "/models/model.pth"
                - name: service_name
                  value: "mnist-svc"

✅ 提示：实际项目中应将上述模板转换为 .py 文件并通过 kfp.compiler.compile() 编译为YAML。

4. 编译并提交流水线

# 安装kfp SDK
pip install kfp

# 编写Python DSL脚本（main.py）
from kfp import dsl
from kfp.components import create_component_from_func

@dsl.pipeline(name="MNIST Training Pipeline", description="Train and deploy MNIST classifier")
def mnist_pipeline(epochs: int = 10):
    prepare_task = create_component_from_func(
        func=prepare_data,
        base_image="python:3.9-slim",
        packages_to_install=["torch", "torchvision"]
    )(data_dir="/data/mnist")

    train_task = create_component_from_func(
        func=train_model,
        base_image="pytorch/pytorch:latest",
        packages_to_install=["torch", "torchvision"]
    )(data_dir="/data/mnist", model_path="/models/model.pth", epochs=epochs)

    eval_task = create_component_from_func(
        func=evaluate_model,
        base_image="pytorch/pytorch:latest"
    )(data_dir="/data/mnist", model_path="/models/model.pth")

    deploy_task = create_component_from_func(
        func=deploy_serving,
        base_image="python:3.9-slim"
    )(model_path="/models/model.pth", service_name="mnist-svc")

    # Dependency chain
    train_task.after(prepare_task)
    eval_task.after(train_task)
    deploy_task.after(eval_task)

# Compile pipeline
from kfp.compiler import Compiler
Compiler().compile(mnist_pipeline, "mnist_pipeline.yaml")

然后上传到Kubeflow Dashboard或使用CLI提交：

kfctl apply -f mnist_pipeline.yaml

模型服务化：Triton Inference Server 集成实战

Kubeflow 1.8 推荐使用 Triton Inference Server 替代KFServing，它支持更高性能的推理服务。

1. 模型导出为ONNX格式

# export_model.py
import torch
import torch.onnx

model = Net()
model.load_state_dict(torch.load("/models/model.pth"))
model.eval()

dummy_input = torch.randn(1, 1, 28, 28)

torch.onnx.export(
    model,
    dummy_input,
    "/models/mnist.onnx",
    input_names=["input"],
    output_names=["output"],
    opset_version=13
)

2. 部署Triton服务

# triton-deployment.yaml
apiVersion: machinelearning.seldon.io/v1
kind: SeldonDeployment
metadata:
  name: triton-mnist
spec:
  name: mnist-triton
  predictors:
    - name: default
      replicas: 1
      componentSpecs:
        - spec:
            containers:
              - name: triton
                image: nvcr.io/nvidia/tritonserver:24.04-py3
                ports:
                  - containerPort: 8000
                    name: http
                  - containerPort: 8001
                    name: grpc
                volumeMounts:
                  - mountPath: /models
                    name: model-storage
                args:
                  - --model-repository=/models
                  - --strict-model-config=true
                  - --log-level=INFO
            volumes:
              - name: model-storage
                persistentVolumeClaim:
                  claimName: triton-pvc

✅ 创建PVC：

apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: triton-pvc
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 1Gi

将ONNX模型放入 /models/mnist/1/model.onnx 并启动服务。

最佳实践与生产建议

1. 使用GitOps管理流水线

将 pipeline.yaml、components/ 目录纳入Git仓库，配合 Flux 或 Argo CD 实现自动同步。

# .flux/flux.yaml
apiVersion: flux.weave.works/v1beta1
kind: HelmRelease
metadata:
  name: kubeflow-pipeline
spec:
  chart:
    git: https://github.com/your-org/mnist-pipeline.git
    ref: main
    path: charts/kubeflow
  values:
    pipelines:
      enabled: true

2. 启用日志与监控

使用Prometheus + Grafana收集流水线指标
通过ELK Stack集中管理日志
在Seldon Core中开启metrics和tracing

3. 模型版本控制与回滚

使用MLMD记录每次训练的版本
通过Seldon Core实现A/B测试与蓝绿部署
设置自动回滚策略（如准确率下降超过阈值）

4. 安全与合规

使用Istio或Linkerd实施mTLS通信
所有镜像必须经过签名验证（Cosign）
敏感信息使用Secrets管理，禁止硬编码

总结：Kubeflow 1.8——通往企业级AI云原生的桥梁

Kubeflow 1.8 不仅仅是一次版本迭代，更是云原生AI平台成熟化的里程碑。它通过整合Kueue、Triton、Argo Workflows、MLMD等先进技术，构建了一个可扩展、自动化、安全可信的MLOps生态系统。

无论是初创公司快速验证AI想法，还是大型企业构建跨团队协作的AI工厂，Kubeflow 1.8 都提供了坚实的技术底座。其核心价值在于：

✅ 统一平台：打破数据科学家与DevOps之间的壁垒
✅ 端到端流水线：从数据到服务的全链路可追踪
✅ 弹性伸缩：基于Kubernetes实现资源按需分配
✅ 可复用组件：支持模块化开发与团队共享

未来，随着Kubeflow与Kubernetes生态的深度融合，我们有望看到更多AI原生应用在云上无缝运行。拥抱Kubeflow 1.8，就是拥抱下一代AI工程化标准。

🔗 参考资料：

Kubeflow 官方文档

Triton Inference Server 文档

Kueue 官方介绍

ML Metadata GitHub

作者：AI平台架构师 | 发布于 2025年4月 | 标签：Kubeflow, Kubernetes, AI, 云原生, MLOps

Kubernetes原生AI应用部署新趋势：Kubeflow 1.8最新特性深度解析与实战应用

引言：迈向云原生AI的新纪元

Kubeflow 1.8 核心新特性概览

1. 基于Kueue的资源调度器增强（Resource Scheduling with Kueue）

2. 自动化MLOps流水线（Pipeline-as-Code with Argo Workflows + Tekton）

3. 模型服务化新范式：KFServing 与 Triton Inference Server 集成

4. 新增模型注册中心（Model Registry）与元数据管理

5. 安全增强与RBAC权限控制完善

Kubeflow 1.8 架构演进与组件关系图解

关键组件说明：

实战部署：Kubeflow 1.8 在Kubernetes集群上的安装

1. 准备环境

2. 安装 Kubeflow 1.8

步骤一：添加 Helm 仓库

步骤二：创建命名空间

步骤三：部署 Kubeflow 核心组件（使用 Helm）

步骤四：等待组件就绪

步骤五：暴露Dashboard

构建首个AI流水线：从数据到模型部署

场景描述

1. 准备项目结构

2. 定义组件（Component Definition）

`components/prepare_data.py`

`components/train_model.py`

`components/evaluate_model.py`

`components/deploy_serving.py`

3. 定义流水线（pipeline.yaml）

4. 编译并提交流水线

模型服务化：Triton Inference Server 集成实战

1. 模型导出为ONNX格式

2. 部署Triton服务

最佳实践与生产建议

1. 使用GitOps管理流水线

2. 启用日志与监控

3. 模型版本控制与回滚

4. 安全与合规

总结：Kubeflow 1.8——通往企业级AI云原生的桥梁

相似文章

评论 (0)

Kubernetes原生AI应用部署新趋势：Kubeflow 1.8最新特性深度解析与实战应用

引言：迈向云原生AI的新纪元

Kubeflow 1.8 核心新特性概览

1. 基于Kueue的资源调度器增强（Resource Scheduling with Kueue）

2. 自动化MLOps流水线（Pipeline-as-Code with Argo Workflows + Tekton）

3. 模型服务化新范式：KFServing 与 Triton Inference Server 集成

4. 新增模型注册中心（Model Registry）与元数据管理

5. 安全增强与RBAC权限控制完善

Kubeflow 1.8 架构演进与组件关系图解

关键组件说明：

实战部署：Kubeflow 1.8 在Kubernetes集群上的安装

1. 准备环境

2. 安装 Kubeflow 1.8

步骤一：添加 Helm 仓库

步骤二：创建命名空间

步骤三：部署 Kubeflow 核心组件（使用 Helm）

步骤四：等待组件就绪

步骤五：暴露Dashboard

构建首个AI流水线：从数据到模型部署

场景描述

1. 准备项目结构

2. 定义组件（Component Definition）

components/prepare_data.py

components/train_model.py

components/evaluate_model.py

components/deploy_serving.py

3. 定义流水线（pipeline.yaml）

4. 编译并提交流水线

模型服务化：Triton Inference Server 集成实战

1. 模型导出为ONNX格式

2. 部署Triton服务

最佳实践与生产建议

1. 使用GitOps管理流水线

2. 启用日志与监控

3. 模型版本控制与回滚

4. 安全与合规

总结：Kubeflow 1.8——通往企业级AI云原生的桥梁

相似文章

评论 (0)

选择表情

`components/prepare_data.py`

`components/train_model.py`

`components/evaluate_model.py`

`components/deploy_serving.py`