工商信息采集

我要开发同款
proginn11263730192023年10月10日
51阅读
所属分类爬虫

作品详情

1、从国内第三方工商信息平台进行信息采集,满足银行柜台对公开户的信息校验和自动填充。包括企业工商基本照面信息,基本信息截图,股权穿透(不超过5层)。2、该项目为纯后端项目,使用Java第三方库selenium 驱动chrome浏览器来进行信息采集。后端开发只有我一个人,从开始开发到上线有50天左右。3、项目中难点主要有两个:1):信息源网站的频发变更,会造成采集程序的失败,主要通过被动及时的进行维护上线来进行解决。2):IP地址的频繁被封,主要采用squid结合自动拨号服务器来进行IP池的更改和IP的动态代理更换。3):登陆时图形界面的识别,滑块类通过自主开发工具来识别滑动解决,文字识别类通过第三方接口来识别,返回对应的坐标,来模拟点击解决。
查看全文
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论