采用面向对象的设计,以及策略类的设计模式,对货运公司的各种PDF模板抽取并清洗指定数据,,以JSON形式保存,最后生成比对的EXCEL文件亮点: 1. 采用框取关键词的四周来确定需要文本的内容 2. 公司的配置信息通过数据库来维护 3. 因为提前将数据清洗好,后面比对的过程相对简单许多 4. 采用消息队列和OSS形式来管理对货运公司的发过来的文件,方面进行模板开发和保存识别结果
评论