从0到1开发机器学习平台 纳管多个云上的gpu和cpu-k8s集群
任务功能
多集群多队列多用户组
gpu多机训练,tensorboard可视化
工作流cpu/gpu数据处理
云仿真,单机仿真任务
开发机
gpu-share开发机1虚n
gpu双卡开发机
cpu开发机
save镜像
原地重启
cfs/pfs持久化存储
alluxio缓存
4种维度监控、本地和云平台日志
支持优先级
点击空白处退出提示
语言技术
K8S、Falcon prometheus、Go
从0到1开发机器学习平台 纳管多个云上的gpu和cpu-k8s集群
任务功能
多集群多队列多用户组
gpu多机训练,tensorboard可视化
工作流cpu/gpu数据处理
云仿真,单机仿真任务
开发机
gpu-share开发机1虚n
gpu双卡开发机
cpu开发机
save镜像
原地重启
cfs/pfs持久化存储
alluxio缓存
4种维度监控、本地和云平台日志
支持优先级
评论