解决 3D 视觉 AI 项目中 Open3D 点云处理任务算力波动大、资源成本高的痛点,平衡 AI 任务效率与算力成本。
点击空白处退出提示
解决 3D 视觉 AI 项目中 Open3D 点云处理任务算力波动大、资源成本高的痛点,平衡 AI 任务效率与算力成本。
核心围绕 “AI 算力弹性伸缩” 构建全流程能力,适配 Open3D 驱动的 3D 视觉 AI 任务特性:
1. 基于 KubeRay + 容器云实现 GPU/CPU 节点按 AI 场景指标(推理延迟 / GPU 利用率)弹性伸缩;
2. 分布式调度 Open3D 点云 AI 任务,定制 GPU/CPU资源调度策略适配需求;
3. 全链路监控保障弹性伸缩过程中任务连续性。
项目职务:负责人
技术栈: Open3D、KubeRay/Ray、Kubernetes、GPU 虚拟化、3D 计算机视觉、AI 推理 / 训练、Prometheus、Python
项目实施内容:
1. 架构层:基于 Kubernetes 部署 KubeRay 集群,搭建 “主控节点 + 弹性计算节点” 的分布式架构,主控节点负责任务调度与伸缩决策,计算节点承载 Open3D 的 3D 视觉 AI 任务,支持 GPU/CPU 异构资源调度;
2. 伸缩逻辑实现:通过 Python 开发伸缩策略脚本,对接 Ray Autoscaler API 与 K8s HPA,定义 AI 场景专属的伸缩阈值,实现算力需求与节点数量的动态匹配;
3. 任务优化实现:基于 Open3D 的 Python API 拆分点云处理任务,通过 Ray 的ray.remote装饰器实现任务并行化,结合 KubeRay 的节点标签机制,将 CUDA 加速任务调度至 GPU 节点,提升任务执行效率;




评论