该项目主要是为需要使用GPU进行AI训练的用户提供一个算力租赁平台:
1. 平台官网、管理后台
技术栈:Node.js、Koa.js、RocketMQ、Redis、MySQL等。
● 从零开始参与了整个平台的前端及后端开发,搭建了一个功能完善的系统以满足对数百台设备的管理和为数万用户提供服务的 需求;
● 完成了用户、机器、实例、数据、镜像、数据集、订单等多种管理功能的开发,实现了对平台的全方位管理和监控;
● 开发了包含代理人、积分、优惠券、代金券、数据统计等一系列运营工具,显著提升了运营团队的效能,并增强了平台对用户 的吸引力;
2. agent 服务、agent 客户端
技术栈:Golang、Beego、Docker等。
● 参与 agent 服务开发,根据用户订单任务完成多机器多显卡的调度;
● 参与 agent 客户端开发,根据服务端下发的指令完成实例的生命周期管理;