个人介绍
1. 熟练掌握 Python 语言,具有良好的代码编码规范;
2. 熟练使用Python的爬虫框架,如Scrapy、Scrapy-redis等;
3. 具有反爬虫经验,理解并熟练使用爬虫反爬机制(封IP问题、验证码问题、动态UA 请求头、Cookies模拟登录、字体反爬,Fiddler抓包等) ;
4. 熟练使用js逆向来处理加密问题;
5. 熟练在爬虫中使用多线程、多进程、协程开发 ;
6. 熟练使用 XPath、BeautifulSoup 、re等网页信息抽取技术以及json 序列化技术 ;
7. 熟练使用Numpy、Pandas 等主流数据分析模块 ;
8. 熟练使用 jieba、requests、pypinyin 等第三方模块 ;
9. 熟练使用 MongoDB、Redis、MySQL 等多种关系型、非关系型数据库;
10. 熟练使用PyEcharts,matplotlib可视化技术;
11. 熟练使用Logging监控爬虫状态;
12. 熟练使用git仓库;
13. 熟练使用APScheduler对程序实现定时设计;
14. 熟练DrissionPage,selenium自动化;
15. 熟练影刀,UiBot等主流rpa工具;
16. 熟悉Django,flask等后端框架;
17. 熟悉HTML,CSS,Javascript。
工作经历
2023-09-11 -2025-05-27武汉金策略信息科技有限公司爬虫工程师
1.负责开发高效的爬虫程序,自动化获取业务数据; 2.负责业务数据的持续化采集与更新; 3.负责对解决不同数据源带来的反爬问题 4.解决项目中遇到的逆向问题 5.对获取的数据进行清洗,去重,整合等处理,确保数据的准确性与一致性,并对数据进行持久化存储; 6.参与数据展示的部分工作; 7.与项目团队保持紧密沟通,及时反馈开发进度。
教育经历
2018-09-01 - 2022-07-01武汉科技大学数据科学与大数据技术本科


