1.主要分日志模块、读取EXCEL模块、写入数据库模块。 1.主要读取excel相关数据,用于与爬取的网站的代码,过滤无效的代码,相应滑块验证的处理。 3.难点:滑块的处理,解决方案:google目前对接的平台。简单的可用OCR识别。
评论