跨境电商实时数仓搭建

我要开发同款
小包努力成为全栈2023年09月04日
72阅读
开发技术java
所属分类scala、flink、跨境电商、实时数仓

作品详情

内容: 项目简介: 随着离线数仓的完善,每日统计的指标随之增加,许多新指标对于时效性有着更高的要求,而T+1离线数仓无法满足需求,于是公司决定搭建实时数仓,实现各类指标的实时统计,最后将统计结果进行实时可视化展出。技术描述:1、使用Maxwell实时同步Mysql中的业务数据,导入到Kafka对应topic中,与实时采集过来的用户行为日志数据共同作为ods层;2、对于用户行为日志数据,利用Flink的侧输出流来实现对日志数据的分流,将不同的流输出到Kafka不同的topic中,作为dwd层;3、对于业务数据,在Mysql中建立动态配置表,同步到Flink中作为广播流,与业务数据流进行关联,实现动态分流效果,将事实表写入Kafka,维度表写入Hbase;4、使用Redis作为旁路缓存优化,以避免频繁访问Hbase数据库,提高查询速度;5、使用异步查询优化,单个并行可以连续发送多个请求而不需要阻塞式等待,提高流处理查询效率;6、使用Flink的IntervalJoin来实现事实表与事实表的关联,并读取维度数据进行维度补全,做成宽表写入Kafka,作为dwm层;内容: 项目简介: 随着离线数仓的完善,每日统计的指标随之增加,许多新指标对于时效性有着更高的要求,而T+1离线数仓无法满足需求,于是公司决定搭建实时数仓,实现各类指标的实时统计,最后将统计结果进行实时可视化展出。技术描述:1、使用Maxwell实时同步Mysql中的业务数据,导入到Kafka对应topic中,与实时采集过来的用户行为日志数据共同作为ods层;2、对于用户行为日志数据,利用Flink的侧输出流来实现对日志数据的分流,将不同的流输出到Kafka不同的topic中,作为dwd层;3、对于业务数据,在Mysql中建立动态配置表,同步到Flink中作为广播流,与业务数据流进行关联,实现动态分流效果,将事实表写入Kafka,维度表写入Hbase;4、使用Redis作为旁路缓存优化,以避免频繁访问Hbase数据库,提高查询速度;5、使用异步查询优化,单个并行可以连续发送多个请求而不需要阻塞式等待,提高流处理查询效率;6、使用Flink的IntervalJoin来实现事实表与事实表的关联,并读取维度数据进行维度补全,做成宽表写入Kafka,作为dwm层
查看全文
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论