从小傻乎乎-上海Java-程序员客栈

1月前来过

B级 T4

道客

云原生-大数据架构师

上海

全职 · 1200/日 · 26100/月信用正常

工作时间: 工作日00:00-23:00、周末00:00-23:00工作地点: 上海

服务企业: 1家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

1. 熟悉大数据组件在云原生环境下的容器化部署

2. 熟悉Flink组件在实时及离线中的应用及各种异常状态处理;

3. 熟悉Flink在实时场景中所面对的架构处理和技术风险规避;

4. 熟悉Kafka底层运行原理和各组件的性能整合；

5. 熟悉ClickHouse/Doris组件的使用和底层原理;

6. 熟悉Spark的使用和优化;

7. 熟悉Hadoop组件的使用及hdfs存储,yarn的调度原理;

8. 熟悉hive组件在离线数据开发中的应用及各种数据转换；

9. 熟悉数仓分层架构和分层逻辑，针对模型以解耦合的底层逻辑做分层处理；

10. 擅长数仓分层和业务模型转换，尤其对于快消行业在广告投放和客户二次运营中的数据处理;

11. 熟悉数据质量体系的搭建，数据治理的工作过程、冷热数据隔离、划分标准和整理思路;

12. 了解kubernetes的资源调度原理和使用;

13. 了解Docker容器化部署和k8s的交互使用;

14. 了解数据调度组件如sqoop/DataX的使用;

15. 了解各种任务调度工具如DolphinScheduler的使用；

2016-08-01 -2023-08-27道客云原生-大数据架构师
公司：上海道客网络科技有限公司职位描述：云原生-大数据架构师/大数据平台开发职责描述： 1、针对数据上云的需求，根据不同大数据组件在云原生环境下的需求，给出适合部署的云原生环境方案; 2、针对部署过程中的发生难点，如HDFS-HA以pod形式部署时，产生的具体资源限制，持久化存储所增加的部署难度给出解决方案 3、结合组件官网资源，考虑到部署在云原生环境后的产生的性能、稳定等问题针对性测试和调研，并结合云原生存储组件Piraeus/Longhorn/NFS等，做出针对性能测试，给出最优存储解决方案。 4、针对云原生-大数据组件部署中产生的难点及问题，尝试解决并给出对应解决方案

2008-07-01 - 2012-07-01阜阳师范学院信息工程学院计算机科学与技术本科

协作开发者

Python精通

Kafka精通

Hadoop精通

Docker精通

Java精通

作品

中国邮储银行用户流水实时分析监控系统

项目：中国邮储银行用户流水实时分析监控系统时间：2021年10月--2022年3月技术选型: FlinkCDC+Flink+Kafka+GuassDB+Nginx+Hadoop+Hive+Spark+Zookeeper+Promethus 语言构成：java/flinkSql 项目描述：应邮储总行对于业务的要求，对邮储银行现有用户消费流水数据和业务模型进行整合,改造现有数据库，并加入flink组件的实时分析功能，增强用户画像和用户流水的分析功能责任描述： 1. 撰写项目设计文档和实施文档，在项目实施的过程中，针对双流join中的数据延迟、Sink中保证exactly-once语义，保证数据库写入性能、kafka数据积压监控、被压处理和Flink任务重启保证等的技术处理提前做出对应策略。 2. 使用kafka producer对接邮储银行自有数据系统CDC，resource数据质量考核系统，对数据做分类处理。 3. 使用 Flink消费kafka实时传入数据，按照要求将消费的json格式数据解析过滤后及计算，对接不同需求，得出最终分析结果，并将结果写入openguass做使用。 4. 整合数据质量，过滤无效字段和无效数据，对接业务给出数据分层模型逻辑。合理建表后将json数据写入kafka，使用FlinkSql直接映射kafka形成table做数据需求的处理。 5.使用GuassDB应用映射kafka数据源形成实时数仓，最后导入数据，做前端展示.

2023-08-27 17:06

云原生-大数据平台

项目：道客云-大数据云原生化平台时间：2022年3月--2023年6月技术选型: Kubenetes+Docker+hdfs+yarn+hive+spark+hbase+zookeeper+kafka+hue+promethus+TiDB 语言构成：java/shell/go 项目描述：为应对数据上云的趋势和需求，合理整合云原生技术的架构设计和大数据处理平台，充分利用云计算资源，使大数据集群具有良好的弹性、可扩展性和自动化管理能力，为大数据应用提供高效、可靠的支持而搭建。项目职责： 1.调研kafka/hdfs/spark等组件的部署及在云原生化的环境下，组件所产生的依赖、通信、环境兼容等问题，提出意见和解决方案； 2.针对云原生的NFS等StorageClass所存在的高并发、性能瓶颈问题，建议更换为longhorn/piraeus等存储组件，并给出测试数据及应对方案; 3.根据集群状态和metrics接口，对接pomethus和TiDB，实现集群状态可视化，同时统一管理日志，最大程度减轻运维压力。 4.针对部署过程中的发生难点，如HDFS-HA以pod形式部署时，产生的具体资源限制，持久化存储所增加的部署难度给出解决方案

2023-08-27 17:05

大数据流批一体

2023-08-27 17:04

更新于: 2023-08-27 浏览: 308

个人介绍

工作经历

教育经历

资质认证

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐