项目介绍:本项目是一个模拟新能源汽车数据搭建的离线数仓项目,它能够实现从数据采集平台到数仓建模以及数据可视化的整个过程。在该项目中,数据同步方案使用全量同步,利用Datax批量同步数据库数据到数据仓库。项目基于Hive on Spark架构完成了大规模数据的存储和计算,并使用Dolphinscheduler进行数据的调度,最后将数仓ADS层的数据同步到MySql中并使用Superset可视化平台将数据可视化呈现。
点击空白处退出提示
项目介绍:本项目是一个模拟新能源汽车数据搭建的离线数仓项目,它能够实现从数据采集平台到数仓建模以及数据可视化的整个过程。在该项目中,数据同步方案使用全量同步,利用Datax批量同步数据库数据到数据仓库。项目基于Hive on Spark架构完成了大规模数据的存储和计算,并使用Dolphinscheduler进行数据的调度,最后将数仓ADS层的数据同步到MySql中并使用Superset可视化平台将数据可视化呈现。




评论