

全职 · 300/日 · 6525/月信用一般
工作时间: 工作日09:30-18:00工作地点:
远程
服务企业:
0家累计提交:
0工时
联系方式:
********
********
********



个人介绍
我是程序员客栈的Haku,一名数据工程师;
我毕业于西华大学,担任过外企的data engineer;
负责过爬取整理疫情期间的国内疫情风险等级数据、中高风险区域数据、城市出入的防疫政策、城市最新疫情新闻、疫情常见问答、各国前一天的新增病例数及中高风险地区的经纬度坐标数据的获取难度,确定数据源等工作;通过地图api接口,辅助wiki及google翻译匹配不同国家城市便捷经纬度数据,实时获取bilibili各类影视数据排行榜等项目
工作经历
2021-01-14 -2024-08-07新拓尼克科技有限公司Data Engineer
参与数据源评估,根据数据需求,编写scrapy爬虫脚本,根据测试需求进行数据清洗,熟练使用requests,scrapy,MongoDB,pandas,re,xpath及webdriver等技术手段
2018-10-08 -2020-04-08成都信威恒科技有限公司软件开发助理
对提供的各个招投标网站进行数据抓取,通过pyspider实现各个爬虫的获取需要的公告信息,对数据通过bloom filter进行去重过滤,MongoDB分表存储
教育经历
2013-09-04 - 2018-06-28西华大学软件工程本科
语言
普通话
0
1
2
3
4
5
0
1
2
3
4
5
技能
0
1
2
3
4
5
0
1
2
3
4
5