Ein1111Java-程序员客栈

1月前来过

D级

大数据开发工程师

成都

全职 · 400/日 · 8700/月信用正常

工作时间: 工作日09:00-06:00工作地点: 远程

服务企业: 0家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

热爱编程，初中自学了C语言和汇编。

实事求是，愿意听取上级的意见和批评，从未与上级和同事发生冲突。

有一定的意志力和抗压能力，已坚持健身持续一年之久。

2019-09-13 -2023-03-06山西传世科技有限公司大数据开发工程师
负责Spark、Flink、Hive、SQL编码；参与会议制定需求；对接后端人员指定数据格式；协助测试人员和前端人员测试接口。

2015-09-01 - 2019-07-01山西工商学院计算机科学与技术本科

Kafka熟悉

Java掌握

作品

网页爬虫

基于WebMagic框架，爬取网页信息。爬取技术采用的是CSS选择器，具体又涉及层次选择器和子元素选择器。第二章截图展示了如何处理服务器响应异常。

2023-06-08 13:44

互联网广告

## 互联网广告（开始时间不详，止于2020.11） ### 概述运用大数据技术细分用户喜恶，再根据用户喜恶权重投放广告，从而大幅提升了广告的转化率。 ### 实现数据采集： - 使用Flume从各日志服务器采集埋点日志到Kafka。 - 使用Sqoop从MySQL导入数据到HDFS。数据处理： - 实时 - 使用SparkStreaming实时处理来自Kafka的数据并保存结果到Redis。 - 离线（先用Flume从Kafka采集数据到ODS层，此步骤起到一个备份的作用。再用Spark清洗数据到DWD层，用于离线处理的统一入口） - 使用Hive分层搭建数仓并保存结果到MySQL。 - 使用Spark对用户打标签并保存结果到HBase。 - 使用推荐算法分析数据并保存结果到MySQL。数据展示：使用ECharts展示数据。 ### 个人职责搭建Flume集群。参与Spark离线编码（含ETL）。使用Hive离线编码。打标签以生成用户定向。对接后端人员。协助测试人员。参与会议。杂项任务：校验数据。

2023-06-08 13:36

物流大数据

### 概述运用互联网、大数据、AI技术（尚未引入，我离职时正在招聘机器学习工程师）构建信息化的物流平台，连接物流、仓库、人、车、物等所有管理对象，从而降低运营成本。 ### 实现数据处理： - 实时 - 根据“数据操作类型”清洗数据并保存到Redis。 - 异步关联维度表以生成宽表并保存到Kafka。 - 风控：生成风控数据并保存到redis。 - 大屏：生成大屏数据并保存到mysql。 - 使用flinksql三流join并保存到mysql。 - 离线 - 使用sqoop编写shell脚本从mysql导入数据到hive。 - 一层表沉淀。 - 二层表沉淀。 - 指标计算。 - 离线指标计算。 - 风控。数据展示：先用MyBatis映射Java接口和数据库，再用SpringMVC接口生成JSON数据。 ### 个人职责参与Flink实时编码。参与Hive和MySQL离线编码。参与Sqoop脚本编写。协助前端人员测试数据接口。对接数据分析师。对接产品经理。对接后端人员。协助测试人员。参与会议。杂项任务：迁移数据库、校验数据。

2023-06-08 13:35

更新于: 2023-06-08 浏览: 237

个人介绍

工作经历

教育经历

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐