本项目解决企业业务系统(MySQL、Oracle)与大数据平台数据割裂、同步不及时、数据一致性差的痛点,搭建全量+增量数据同步体系,实现业务数据的实时/准实时集成,为上层数仓建设、数据分析提供稳定可靠的数据来源。
点击空白处退出提示
本项目解决企业业务系统(MySQL、Oracle)与大数据平台数据割裂、同步不及时、数据一致性差的痛点,搭建全量+增量数据同步体系,实现业务数据的实时/准实时集成,为上层数仓建设、数据分析提供稳定可靠的数据来源。
项目包含多源数据接入、全量/增量同步、数据清洗转换、维度表构建、调度运维五大模块。支持关系型数据库到大数据平台的自动化数据同步,完成数据去重、补全、关联等加工处理,构建统一公共维度层与业务宽表,提供数据异常告警、链路监控、数据核对功能,保障数据同步的稳定性、准确性与时效性。
本人负责数据同步方案设计,使用Sqoop、Spark开发ETL同步脚本,完成多源数据的抽取、转换与加载,构建公共维度表与业务宽表,对接调度平台实现自动化运维,处理数据异常告警与问题排查,保障数据链路稳定、口径统一。




评论