1.多线程爬取,能加快爬虫速度。2.支持复杂网站的数据爬取,如ajax类型的网站。3.提供了丰富的工具类,使得爬虫工作非常轻松,封装了队列类,封装了hashmap等。4.这个框架基于广度优先遍历算法设计的,写代码只需要考虑url 规则去写,不要考虑复杂的网页跳转逻辑。
评论