1、从国内第三方工商信息平台进行信息采集,满足银行柜台对公开户的信息校验和自动填充。包括企业工商基本照面信息,基本信息截图,股权穿透(不超过5层)。
2、该项目为纯后端项目,使用Java第三方库selenium 驱动chrome浏览器来进行信息采集。后端开发只有我一个人,从开始开发到上线有50天左右。
3、项目中难点主要有两个:1):信息源网站的频发变更,会造成采集程序的失败,主要通过被动及时的进行维护上线来进行解决。2):IP地址的频繁被封,主要采用squid结合自动拨号服务器来进行IP池的更改和IP的动态代理更换。3):登陆时图形界面的识别,滑块类通过自主开发工具来识别滑动解决,文字识别类通过第三方接口来识别,返回对应的坐标,来模拟点击解决。
点击空白处退出提示












评论