1、下载每一个案子的docx需要
这个 url 地址
2、经过分析每一个案子的docx url 地址 组成为 domain(域名)+case id(案子标记符)+faxin token(登录用户标记符)+TENANT_ID(id标记)+type(下载文档类型) ;域名、TENANT_ID和文档类型是死的,用户token也可以通过每次登录后查看浏览器获取到,那关键就是获取到案子标记符。怎获取案子 标识符呢?
3、通过分析谷歌浏览器 DevTools开发者工具的 Network 查看到内容请求是通过search请求获取到的。 search 请求的 url 为 https://wenshu.faxin.cn/faxin/search/search 请求体为 巴拉巴拉... (JSON格式) :包含每次 请求的关键词、筛选的年份、刑事类型,以及每次获取的案子分页信息(from: xxx ,size :10) 响应体为 巴拉巴拉.... (JSON格式) : 返回数据包括 每个案子的 标记符 即为 类似:"uniqid": "9bd96bba-ef58-f61b-8304-d75635e58975"
这样上述问题要获取案子标识符id的问题就得以解决
这样写个循环,每次请求设置好 请求筛选参数、分页信息、用户标识符等 ,就可以得到返回信息的案子标识符id
然后根据步骤1 拼接url 下载文档即可。
点击空白处退出提示
评论