项目名称:GeneFactory分布式基因数据生产自动化云平台
时 间:2018年7月至2019年7月(项目周期12月)
项目概述:(项目人数10人)
该项目主要是实现对实验室给出的DNA测序数据进行分析提取并根据算法进行运算最终给出用户报告数据。因为生物数据分析步骤复杂,人工操作易出错,系统采用argo+k8s云计算架构,实现了流程编排,自动化触发运行,几十多台服务器分布式对DNA数据的初步提取,以及用户报告的生成。
业绩和成果:
系统完成后,能够实现自动化数据分析为用户生成结果报告,给公司创造了交付价值。 从人工处理变成自动化处理,提高了处理效率,突破效率瓶颈,节省了人工成本。目前已经累计完成了接近一百万人的基因数据分析。最多同时运行200多台服务器,目前数据量级几百TB。
工作职责:
1、技术方案选型,功能模块和架构设计
2、部分功能的sdk模块的编写
3、项目管理和跨团队沟通
主要技术:
1、 底层主要采用了argo和k8s实现任务编排和分布式云运算
2、 存储方面采用了s3、mongodb,mysql等技术
3、 前端页面方面: html,css,js,vue
4、