大数据开发Python-程序员客栈

1月前来过

技术员

全职 · 300/日 · 6525/月信用一般

工作时间: 工作日09:00-05:00工作地点: 远程

服务企业: 0家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

我是一名大数据开发工作者，熟悉基于Hadoop⽣态体系的⼤数据集群架构HDFS/YARN/MR，具备⼤规模分布式集群部署、性能调优及运维能⼒掌握ETL全流程开发，熟练运⽤MapReduce/Spark/Flink等计算引擎实现异构数据清洗、转换与质量管控，设计⾼效数据管道掌握ZooKeeper分布式协调服务原理，具备Kafka⾼吞吐消息系统架构设计与Flume⽇志采集系统的实战经验等，如果我的技能对您有帮助，欢迎合作！

2024-05-05 -2024-10-08钦州市融媒体中心技术员
负责融媒体中⼼⽹络设备的⽇常维护，确保设备稳定运⾏，及时处理各类⽹络故障承担计算机设备的软硬件维护⼯作，保障员⼯办公设备正常运转对⽹络进⾏⾼效管理，优化⽹络配置，提升整体⽹络性能和安全使⽤⼤数据技术实现融媒体中⼼视频播放量等数据的可视化⼤屏

2019-09-01 - 2023-06-20桂林理工大学计算机科学与技术本科

普通话母语水平

Hadoop熟练

作品

基于Hadoop数据仓库的实现以及优化

项⽬简单描述：通过前端埋点收集⽤⼾⾏为数据数据，业务数据采集采⽤同步策略存储在Mysql，⽤户⾏为数据采集使⽤flume通道，设置ELT拦截器获取⽇志时间戳，通过kafka消息队列暂存⽇志⽂件，业务数据通过Maxwell暂存kafka，所有数据经过⼀系列操作最终流⼊Mysql，通过数据接⼝可以⽣成可视化报表技术栈：Hadoop，Zookeeper，Kafka，Flume，Spark，Hive等项⽬总结：本项⽬主要采集电⼦商务平台的⽤⼾⾏为数据和业务数据，业务数据通过调研最晚可到达200天，每次可抽取处理200天的数据，通过⼤数据组件分析⽤⼾⾏为，利⽤分析结果达到推测⽤⼾喜好，推荐类似商品的效果

2025-05-07 19:48

更新于: 2025-05-07 浏览: 137

个人介绍

工作经历

教育经历

语言

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐