处理从招标网爬回来的信息,如:http://ztbzx.hbsjtt.gov.cn,http://www.ggzy.gov.cn等。提取联系人信息,如:“招标单位”名称,“招标代理单位”名称,以及“地址”、“邮编”、“联系人”、“电话”、“传真”、“电子邮件”、“网址”、“开户银行”、“账号”等联系人信息。抽取指标可以可以自由扩充。测试了从招标网爬取的 860个招标项目,处理结果的准确率大于99%,每个招标项目文档的平均处理速度是 5.2毫秒。
评论