passengerlmy
全职 · 300/日  ·  6525/月
工作时间: 周末09:00-18:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是程序员客栈的一名python工程师

工作经历

  • 2017-12-01 -2022-06-29同方知网职员

    主要负责数据采集数据清洗, 少量前后端开发工作,设计整体数据处理流程,解决多源数据排重问题

教育经历

  • 2013-06-28 - 2017-06-29大连医科大学生物医学工程本科

语言

普通话
0
1
2
3
4
5

技能

0
1
2
3
4
5
作品
数据采集排重系统

1. 负责设计数据排重策略,负责相关模块开发, 及上亿级历史数据排重工作。 2. 负责日更新数据排重相关模块开发,维护数据。 3. 负责疑似重复数据处理,通过计算摘要相似度,完成数据关系确认 4. 熟悉 Scrapy,Requests,Selenium 等爬虫框架,搭建过千万级分布式网络爬虫。 带领小组搭建清洗系统,熟悉正则表达式,Xpath能够从结构化和非机构化的数据中获取信息。

0
2025-08-09 13:38
下载次数:0
¥9999
更新于: 5小时前 浏览: 5