从小傻乎乎
1月前来过
全职 · 1200/日  ·  26100/月
工作时间: 工作日00:00-23:00、周末00:00-23:00工作地点: 上海
服务企业: 1家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

1. 熟悉大数据组件在云原生环境下的容器化部署

2. 熟悉Flink组件在实时及离线中的应用及各种异常状态处理;

3. 熟悉Flink在实时场景中所面对的架构处理和技术风险规避;

4. 熟悉Kafka底层运行原理和各组件的性能整合;

5. 熟悉ClickHouse/Doris组件的使用和底层原理;

6. 熟悉Spark的使用和优化;

7. 熟悉Hadoop组件的使用及hdfs存储,yarn的调度原理;

8. 熟悉hive组件在离线数据开发中的应用及各种数据转换;

9. 熟悉数仓分层架构和分层逻辑,针对模型以解耦合的底层逻辑做分层处理;

10. 擅长数仓分层和业务模型转换,尤其对于快消行业在广告投放和客户二次运营中的数据处理;

11. 熟悉数据质量体系的搭建,数据治理的工作过程、冷热数据隔离、划分标准和整理思路;

12. 了解kubernetes的资源调度原理和使用;

13. 了解Docker容器化部署和k8s的交互使用;

14. 了解数据调度组件如sqoop/DataX的使用;

15. 了解各种任务调度工具如DolphinScheduler的使用;

工作经历

  • 2016-08-01 -2023-08-27道客云原生-大数据架构师

    公 司:上海道客网络科技有限公司 职位描述:云原生-大数据架构师/大数据平台开发 职责描述: 1、针对数据上云的需求,根据不同大数据组件在云原生环境下的需求,给出适合部署的云原生环境方案; 2、针对部署过程中的发生难点,如HDFS-HA以pod形式部署时,产生的具体资源限制,持久化存储所增加的部署难度给出解决方案 3、结合组件官网资源,考虑到部署在云原生环境后的产生的性能、稳定等问题针对性测试和调研,并结合云原生存储组件Piraeus/Longhorn/NFS等,做出针对性能测试,给出最优存储解决方案。 4、针对云原生-大数据组件部署中产生的难点及问题,尝试解决并给出对应解决方案

教育经历

  • 2008-07-01 - 2012-07-01阜阳师范学院信息工程学院计算机科学与技术本科

资质认证

技能

Kafka
Hadoop
Docker
0
1
2
3
4
5
0
1
2
3
4
5
作品
中国邮储银行用户流水实时分析监控系统

项目:中国邮储银行用户流水实时分析监控系统 时间:2021年10月--2022年3月 技术选型: FlinkCDC+Flink+Kafka+GuassDB+Nginx+Hadoop+Hive+Spark+Zookeeper+Promethus 语言构成:java/flinkSql 项目描述: 应邮储总行对于业务的要求,对邮储银行现有用户消费流水数据和业务模型进行整合,改造现有数据库,并加入flink组件的实时分析功能,增强用户画像和用户流水的分析功能 责任描述: 1. 撰写项目设计文档和实施文档,在项目实施的过程中,针对双流join中的数据延迟、Sink中保证exactly-once语义,保证数据库写入性能、kafka数据积压监控、被压处理和Flink任务重启保证等的技术处理提前做出对应策略。 2. 使用kafka producer对接邮储银行自有数据系统CDC,resource数据质量考核系统,对数据做分类处理。 3. 使用 Flink消费kafka实时传入数据,按照要求将消费的json格式数据解析过滤后及计算,对接不同需求,得出最终分析结果,并将结果写入openguass做使用。 4. 整合数据质量,过滤无效字段和无效数据,对接业务给出数据分层模型逻辑。合理建表后将json数据写入kafka,使用FlinkSql直接映射kafka形成table做数据需求的处理。 5.使用GuassDB应用映射kafka数据源形成实时数仓,最后导入数据,做前端展示.

0
2023-08-27 17:06
云原生-大数据平台

项目:道客云-大数据云原生化平台 时间:2022年3月--2023年6月 技术选型: Kubenetes+Docker+hdfs+yarn+hive+spark+hbase+zookeeper+kafka+hue+promethus+TiDB 语言构成:java/shell/go 项目描述: 为应对数据上云的趋势和需求,合理整合云原生技术的架构设计和大数据处理平台,充分利用云计算资源,使大数据集群具有良好的弹性、可扩展性和自动化管理能力,为大数据应用提供高效、可靠的支持而搭建。 项目职责: 1.调研kafka/hdfs/spark等组件的部署及在云原生化的环境下,组件所产生的依赖、通信、环境兼容等问题,提出意见和解决方案; 2.针对云原生的NFS等StorageClass所存在的高并发、性能瓶颈问题,建议更换为longhorn/piraeus等存储组件,并给出测试数据及应对方案; 3.根据集群状态和metrics接口,对接pomethus和TiDB,实现集群状态可视化,同时统一管理日志,最大程度减轻运维压力。 4.针对部署过程中的发生难点,如HDFS-HA以pod形式部署时,产生的具体资源限制,持久化存储所增加的部署难度给出解决方案

0
2023-08-27 17:05
大数据流批一体

项目:道客云-大数据云原生化平台 时间:2022年3月--2023年6月 技术选型: Kubenetes+Docker+hdfs+yarn+hive+spark+hbase+zookeeper+kafka+hue+promethus+TiDB 语言构成:java/shell/go 项目描述: 为应对数据上云的趋势和需求,合理整合云原生技术的架构设计和大数据处理平台,充分利用云计算资源,使大数据集群具有良好的弹性、可扩展性和自动化管理能力,为大数据应用提供高效、可靠的支持而搭建。 项目职责: 1.调研kafka/hdfs/spark等组件的部署及在云原生化的环境下,组件所产生的依赖、通信、环境兼容等问题,提出意见和解决方案; 2.针对云原生的NFS等StorageClass所存在的高并发、性能瓶颈问题,建议更换为longhorn/piraeus等存储组件,并给出测试数据及应对方案; 3.根据集群状态和metrics接口,对接pomethus和TiDB,实现集群状态可视化,同时统一管理日志,最大程度减轻运维压力。 4.针对部署过程中的发生难点,如HDFS-HA以pod形式部署时,产生的具体资源限制,持久化存储所增加的部署难度给出解决方案

0
2023-08-27 17:04
更新于: 2023-08-27 浏览: 181