hcb1256前端-程序员客栈

1月前来过

爬虫程序员

上海

全职 · 400/日 · 8700/月信用正常

工作时间: 工作日08:00-18:30、周末08:00-16:00工作地点: 远程

服务企业: 0家累计提交: 0工时

聊一聊

APP聊一聊

我是爬虫方面的程序员

作品

他的网站的月票数是通过特殊加密的，所以直接爬取是不行的，要先把他的加密woff文件先爬取下来保存到本地，然后把里面的映射表拿出来，一一对应上去，然后最后把我们的月票加密字体对应输出出来就能拿到数据了

2023-04-20 14:30

需要使用到js逆向的内容，他的数据包里面是群看不懂的英文加字母，这其实就是我们要的数据，但是得找到他的js加密文件，并把他扣下来到我们的本地运行，对这群英文数字进行解密才能拿到我们的数据。

2023-04-20 14:32

用scrapy框架爬取京东的书籍，我使用擅长的scrapy_redis的分布式爬虫，非常方便，多节点爬取，速度非常之快，然后我也有使用我的代理ip，防止被封禁ip，最后可以将几万数据很快保存下来，而且可以选择自己的保存方式

2023-04-20 14:33

更新于: 2022-08-27 浏览: 373