Triton 推理服务¶

如果有可运行在 NVIDIA Triton 推理服务的模型，也可使用 Seldon’s Prepacked Triton 服务。

Triton 有多个后端支持，包括 TensorRT, Tensorflow, PyTorch 和 ONNX 模型。更多细节请参考 Triton 支持文档。

示例¶

apiVersion: machinelearning.seldon.io/v1alpha2
kind: SeldonDeployment
metadata:
  name: triton
spec:
  protocol: kfserving
  predictors:
  - graph:
      implementation: TRITON_SERVER
      modelUri: gs://seldon-models/trtis/simple-model
      name: simple
    name: simple
    replicas: 1

请尝试可工作 notebook