proginn718912-珠海Python-程序员客栈

1月前来过

D级

python 开发

珠海

全职 · 1000/日 · 21750/月信用正常

工作时间: 周末2:00-5:00工作地点: 远程

服务企业: 0家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

2、熟悉html、js、 ajax、firedebug
3、网页去重、找到网站特点
4、分布式
5、多线程
6、一种关系型数据库mysql/oraclelserver/mybatis
7、正则表达式、css selector、 xpath
8、DNS cache
9、TCP/IP/Http协议tp2.010、web登录协议

10、 SSO、OAuth原理

11、反爬策略
12、熟悉httpClient、okhttp3...
13、熟悉一些提取工具、jsoup、selenim WebDriver...
14、搜索技术。熟悉Lucene/Nutch/Heritrix/solr/elastic-search/
15、熟悉XML、JSON、SOAP协议；
16、mongodb、 redis、 hbase、 hadoop
17、文本分析、机器学习、数据挖掘、自然语言处理[NLP]
18、完成网页、***、论坛等数据信息的精

2021-04-01 -2023-05-01東軟python 开发
Ø 负责设计开发分布式网络爬虫，进行多平台信息抓取分析工作； Ø 根据业务需求，实现文本、图片数据抓取、清洗、存储工作； Ø 根据业务需求通过抓包技术Wireshark，包括代理、selenium、验证码处理等； Ø 根据业务需求获取各大平台cookies实现模拟登录和模拟请求接口获取数据。