Kubernetes 启用对 A800 MIG 支持
Kubernetes 对 英伟达 A800 mig 的支持
·
参考文档:
https://erhwenkuo.github.io/mlops/02-gpu-sharing/mig/mig-k8s/#_2
https://community-github.cn-sh2.ufileos.com/kpanda/user-guide/gpu/create_mig.html#gpu-mig-single
https://www.lixueduan.com/posts/ai/02-gpu-operator/
https://blog.csdn.net/java_1996/article/details/147921069
helm安装gpu-operator
helm upgrade --install nvidia-gpu-operator-v25 \
-n nvidia-gpu-operator \
nvidia/gpu-operator \
--set operator.defaultRuntime=containerd \
--set mig.strategy=mixed
查询是否生效
kubectl get node -o json | jq '.items[1].metadata.labels | with_entries(select(.key | startswith("nvidia.com")))'


自动默认创建 1g.10gb
一张A800 可以创建 7 个 1g.10gb 共 56 个
启动容器验证查看

更多推荐


所有评论(0)