该项目通过开发一系列数据工具: 元数据中心、数据指标中心、数仓模型中心、数据资产中心、数据服务中心;
我主要负责数据指标和数仓模型功能的开发;
主要的技术栈CDH6.2 + Flink1.10 + Kafka2.1+ Spark2.4 + Hadoop2.7 + Canal1.1 + MySQL5.7 + Kudu1.9 + Impala3.2 + Hue4.3 + ClickHouse0.2 + ElasticSearch7.6 + Azkaban3.7
做项目的过程中,经常会遇到数据倾斜的问题,hive性能优化的问题,主要通过查找yarn日志,找到性能瓶颈,从而针对性优化;
点击空白处退出提示












评论