KubeDL是阿里开源的基于Kuberetes的AI工作负载管理框架,取自"Kuberetes-Deep-Learig"的缩写;旨在使深度学习工作负载能够更轻松、更高效地在Kuberetes上运行。KubeDL是一个CNCFSadbox 项目。
其核心功能包括:在将ML模型部署为推理服务之前自动调整最佳容器级配置。- MorphligGithub用于在CRD中本地跟踪模型历史的模型沿袭和版本控制:何时使用哪些数据和哪些图像训练模型、模型的每个版本、正在运行的版本等。启用利用容器映像存储和版本控制模型。每个模型版本都存储为自己的图像,以后可以使用Servig框架提供服务。在单个统一控制器中支持推理框架和训练工作负载(Tesorflow、Pytorch、Mars等)。











评论