1. 负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;
2. 负责互联网资源清洗和结构化,网页转码,网页聚合,信息抽取,数据清洗,网页分类;
3. 负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;
4. 有票务、股票、证劵等爬虫经验的优先,具备HTML、CSS、JavaScript等前端技术知识,能够解析网页结构;
5. 优化爬虫策略和调度,提升爬取速度、降低资源消耗
点击空白处退出提示
1. 负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;
2. 负责互联网资源清洗和结构化,网页转码,网页聚合,信息抽取,数据清洗,网页分类;
3. 负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作;
4. 有票务、股票、证劵等爬虫经验的优先,具备HTML、CSS、JavaScript等前端技术知识,能够解析网页结构;
5. 优化爬虫策略和调度,提升爬取速度、降低资源消耗
评论