公司购买了一个某医疗器械资源网站的账号,该账号不能同时登陆,导致只能同时让一位员工使用。于是,计划将该网站的数据爬取后保存至数据库,接入公司后台管理系统,为多数员工提供查询;具体步骤:1、selenium模拟登陆,自动识别验证码;2、模拟点击,跳转到指定的页面;3、跳转iframe,xpath获取数据;4、自动填写页码并跳转;解决的难点:模拟登陆、iframe页面嵌入结构、chrome内存泄漏;
评论