地址治理离线数仓分析系统

我要开发同款
proginn13545567132023年03月27日
153阅读
所属分类hadoop、scala、spark、数仓

作品详情

将数据通过Flume 接入到HDFS 集群,通过hivesql 进行数据脏数据过滤和去重,使用Python 对国省市区、姓名、电话标准化,然后调地址服务和电话库进行地址治理和电话解密,最后使用hivesql 做用户画像和图谱,将Hive 表写入图数据库,运用Scala 入ES 和Oracle。责任描述:1、flume 数据接入和数据分析;2、使用python 进行电话解密,编写用户画像;3、使用Scala 将数据写入ES 进行运单分析;4、使用Scala 将中标数据写入Oracle 进行实时预警分析。
查看全文
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论