搭建大数据集群,包含Kafka,Spark,HDFS,Mongodb 等,实现终端数据接入、存储和计算
开发Spark Structured Streaming实现终端报表在线流计算,开发离线Spark RDD批处理任务
采用Hive+Spark+HDFS+YARN构建离线数仓,通过维度建模将数据分层处理
自建K8s集群,统一资源调度,监控告警(Prometheus)和日志管理(Filebeat+ELK)
点击空白处退出提示
搭建大数据集群,包含Kafka,Spark,HDFS,Mongodb 等,实现终端数据接入、存储和计算
开发Spark Structured Streaming实现终端报表在线流计算,开发离线Spark RDD批处理任务
采用Hive+Spark+HDFS+YARN构建离线数仓,通过维度建模将数据分层处理
自建K8s集群,统一资源调度,监控告警(Prometheus)和日志管理(Filebeat+ELK)
评论