



个人介绍
我是一名大数据开发工作者,熟悉基于Hadoop⽣态体系的⼤数据集群架构HDFS/YARN/MR,具备⼤规模分布式集群部署、性能调优及运维能⼒ 掌握ETL全流程开发,熟练运⽤MapReduce/Spark/Flink等计算引擎实现异构数据清洗、转换与质量管控,设计⾼效数 据管道 掌握ZooKeeper分布式协调服务原理,具备Kafka⾼吞吐消息系统架构设计与Flume⽇志采集系统的实战经验等,如果我的技能对您有帮助,欢迎合作!
工作经历
2024-05-05 -2024-10-08钦州市融媒体中心技术员
负责融媒体中⼼⽹络设备的⽇常维护,确保设备稳定运⾏,及时处理各类⽹络故障 承担计算机设备的软硬件维护⼯作,保障员⼯办公设备正常运转对⽹络进⾏⾼效管理,优化⽹络配置,提升整体⽹络性 能和安全 使⽤⼤数据技术实现融媒体中⼼视频播放量等数据的可视化⼤屏
教育经历
2019-09-01 - 2023-06-20桂林理工大学计算机科学与技术本科
语言
技能

项⽬简单描述:通过前端埋点收集⽤⼾⾏为数据数据,业务数据采集采⽤同步策略存储在Mysql,⽤户⾏为数据采集使⽤flume通道,设置ELT拦截器获取⽇志时间戳,通过kafka消息队列暂存⽇志⽂件,业务数据通过Maxwell暂存kafka,所有数据经过⼀系列操作最终流⼊Mysql,通过数据接⼝可以⽣成可视化报表 技术栈:Hadoop,Zookeeper,Kafka,Flume,Spark,Hive等 项⽬总结:本项⽬主要采集电⼦商务平台的⽤⼾⾏为数据和业务数据,业务数据通过调研最晚可到达200天,每次可抽取 处理200天的数据,通过⼤数据组件分析⽤⼾⾏为,利⽤分析结果达到推测⽤⼾喜好,推荐类似商品的效果
