1.对于从保险单上OCR识别的字符进行结构化处理
2.难点在于保险单都是手拍的照片,表格线曲折,而且OCR只是单独的识别字符,因此会造成串行现象,导致规则处理结构化会需要写很多而且效果不好
3.利用从数据库中获取到的正确信息,加上随机配上干扰字符,来训练文本分类,然后通过规则处理,提取信息,准确率在85%以上。
点击空白处退出提示
1.对于从保险单上OCR识别的字符进行结构化处理
2.难点在于保险单都是手拍的照片,表格线曲折,而且OCR只是单独的识别字符,因此会造成串行现象,导致规则处理结构化会需要写很多而且效果不好
3.利用从数据库中获取到的正确信息,加上随机配上干扰字符,来训练文本分类,然后通过规则处理,提取信息,准确率在85%以上。




评论