1、项目针对数据分析中数据清洗、特征提取、统计分析常用的计算方法进行了固化,面向分析人员以规则化的语法形式实现快速的数据分析和结果输出,使用户拜托了定制化、重复性的代码开发工作。
2、在本项目中,个人首先完成了规则化语法以及算子的设计,同时采用akka框架实现了分布式多线程的并行计算,达到了单台128GB服务器实现10Gbps流量数据处理的效率。
3、本项目中的难点在于规则的设计;并行化效率。
点击空白处退出提示
1、项目针对数据分析中数据清洗、特征提取、统计分析常用的计算方法进行了固化,面向分析人员以规则化的语法形式实现快速的数据分析和结果输出,使用户拜托了定制化、重复性的代码开发工作。
2、在本项目中,个人首先完成了规则化语法以及算子的设计,同时采用akka框架实现了分布式多线程的并行计算,达到了单台128GB服务器实现10Gbps流量数据处理的效率。
3、本项目中的难点在于规则的设计;并行化效率。
评论