proginn2202278133
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 工作日19:00-22:00、周末10:00-19:30工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

l 深耕spark,flink运行构架、原理和操作;l 掌握HDFS和MapReduce的运行构架、Yarn任务调度架构;l 擅长数据仓库、数据中台从0到1的建设。掌握离线、实时数据采集、模型设计理论等;l 熟练使用Linux及shell编程,能熟练使用Docker及K8s等容器管理工具;l 掌握 Git,Maven 等工具。l 掌握第三方云平台Airflow,snowflake,aws,s3等,ACP阿里云大数据工程师证1本人不怕吃苦,积极乐观,喜欢运动。2 逻辑思维能力强,思路清楚,学习能力强,对新技术有着强烈的好奇心;3善于与客户以及同事和领导沟通,以便快速解决项目遇到的问题;4.富有逻辑,擅长分析、钻研艰深的难题5..善于合作,长于协调团队与个人的关系6.极强的学习能力,善于领悟、接受新事物和新技术

工作经历

  • 2021-10-15 -至今埃森哲大数据高级分析师

    1.基于dataphin数据中台建设和数据分析。 2.建模工作负责财务域模型设计。开发工作负责从数据入湖、模型落地、测试、验收的工作安排以及跟进以及ETL过程中慢sql的优化。 3.数仓模型建设及业务应用需求支持。bi需求流程梳理和落地,显著降低了与业务沟通成本做到需求跟除及可回溯性。

  • 2020-02-12 -2021-09-30app annie大数据开发工程师

    1.负责数据接入,清洗,转换,参与数据中台,批流一体化的数据处理平台整体架构的设计; 2.负责基于SQL的离线计算执行引擎的研发 3.系统优化spark计算逻辑,提高系统执行效率 4.参与数据分层字段设计,以及数据迁移开发任务

  • 2018-06-01 -2020-01-07第四范式大数据开发

    1.参与功能模块分析及编码实现等 2.负责核心架构设计与实现,核心模块的开发,项目系统调优,性能调优等技术开发和产品迭代; 3.对接行方前置与产品衔接,提供可靠的稳定的,课配置的数据引入和调度服务,保证数据调度正确性,保障机器学习稳定运行;

教育经历

  • 2013-06-30 - 2017-07-31吉林警察学院计算机科学与技术本科

    2013-09 - 2017 -06 吉林警察学院 计算机科学与技术

技能

机器学习
Kafka
Hadoop
ElasticSearch
Docker
多线程
项目管理
架构
0
1
2
3
4
5
0
1
2
3
4
5
作品
嫌疑人追踪系统

项目描述: 为各地网安推出定制化的路由器,在网安指定的公共地点安装我司的路由器,通过路由器或者嗅探设备的mac地址以及经纬度的追踪,可以定位每个人员的上网大致方位,对上网人员的身份进行追踪,通过公共路由器来获取指定人员的行动轨迹,实时对犯罪分子的抓捕,对犯罪分子地理信息定位,经纬度,黑白名单匹配,为各地网安解决各种定制化的任务。 责任描述: 1.数据清理,从kafka过来的不符合要求的数据,用Sparkstreaming进行匹配,把数据处理为结构化数据.同时通过上报数据判断设备状态通知运营人员,以便迅速定位故障设备,对故障设备进行有效维护. 2.嫌疑人黑白名单匹配,Sparkstreaming处理后的数据与redis里的黑白名单规则匹配,如果匹配到,实时将匹配到详细信息,上报当地网安部门.已达到实时追踪嫌疑人的目的. 3.用Sparkstreaming处理后的数据写入hdfs,以便数据分析部门进行数据分析.

0
2023-04-26 15:32
华夏信用卡人工智能系统交易反欺诈场景

项目描述: 基于先知EE3.4版本,场景包括模型调研、自学习、批量预估、时序特征拼接、在线预估等。该系统主要为了进一步提升信用卡竞争力,降低风险,节省人力成本。理论上除数据对接和服务封装之外的工作都在先知EE上完成。是EE首个落地场景,在上海交行、华夏总行、广发之前。 新增交易欺诈线下交易评分模型,提升交易精准率预测,对于模型输出的评分进行准实时输出,传输至PRM系统。PRM系统将引用该评分进行规则筛检及优化,进一步缩减审查工作点击量。 通过数据支撑系统simon,实现各数据源(离线(sas)、在线(prm))数据的整合和入库(pdms/rtidb),对于在线预估反欺诈模型的评分进行实时输出,传输至PRM系统(前置服务),批量预估服务由任务调度器根据任务配置进行触发,定时将批量数据导入pdms,支持触发批量预估服务,将预估结果输出至行方指定系统。 责任描述: 1.数据清理,Simon是基于airflow调度引擎开发的辅助先知系统进行数据etl,通过对接客户系统,将SAS原数据通过客户系统(FTP)中下载到宿主机进行分析处理后,然后再引入pdms. 2.Psp连接行方新前置,接收交易报文,并对交易报文进行验证和去重,Psp作为socket服务端,接收新前置的tcp请求,并转换为在线预估的http请求,调用先知http请求并发送交易数据,并返回在线预估分对交易的评分. 3.将开发完成的psp包,在本地maven环境构建jar包,编写dockerfile,将构建的jar打包镜像上传到docker Repository,并部署到k8s.

0
2023-04-26 15:33
中海油业财一体化数据中台搭建

责任描述: 1、数据现状调研带着从哪采集?采集什么?采集哪些?如何采集?四个疑问出发结合方法论现有数据涉及的系统、数据字典、数据实体对象、存储机制等进行调研,为后续数据采集实施和数据资产的形成莫定了基础 2、数据采集离线采集:利用dataphin离线采集功能,将各个业务系统数据接入中台数据湖: 3、数据建模搭建hive数仓,采用维度建模的方法,将各个业务系统数据划分5层,ODS(按业务系统划)\DWD(按主题域划分)\DWS(按数据域划分)\DIM(公共维表) 4、数据应用(1)利用中台数据湖全面的数据,集中做数据应用产品。包括7大体系100多个财务业务指标展示以及填报按照业需求对报表进行定时更新和填报调整。(2)数据服务基于中台数据湖全面的数据,提供服务API给各事业部使用。(3)数据安全以工作空间、租户、角色、密级等概念对数据访问、数据开发、数据资产进行权限管控 5、为该企业数字化转型打下坚实的基础、真正意义上实现了数据的统一采、统一存、统一管理、统一算、统一服务的一体化大数据平台

0
2023-04-26 15:34
更新于: 2022-06-22 浏览: 93