抓取相关程序_系统开发案例-程序员客栈

1、下载每一个案子的docx需要

这个 url 地址

2、经过分析每一个案子的docx url 地址组成为 domain(域名)+case id(案子标记符)+faxin token(登录用户标记符)+TENANT_ID(id标记)+type(下载文档类型) ;域名、TENANT_ID和文档类型是死的，用户token也可以通过每次登录后查看浏览器获取到，那关键就是获取到案子标记符。怎获取案子标识符呢？

3、通过分析谷歌浏览器 DevTools开发者工具的 Network 查看到内容请求是通过search请求获取到的。 search 请求的 url 为 https://wenshu.faxin.cn/faxin/search/search 请求体为巴拉巴拉... (JSON格式) ：包含每次请求的关键词、筛选的年份、刑事类型，以及每次获取的案子分页信息(from: xxx ,size :10) 响应体为巴拉巴拉.... (JSON格式) : 返回数据包括每个案子的标记符即为类似："uniqid": "9bd96bba-ef58-f61b-8304-d75635e58975"

这样上述问题要获取案子标识符id的问题就得以解决

这样写个循环，每次请求设置好请求筛选参数、分页信息、用户标识符等，就可以得到返回信息的案子标识符id

然后根据步骤1 拼接url 下载文档即可。

抓取相关程序

功能介绍

示例图片

重点城市程序员兼职推荐

重点岗位程序员兼职推荐