利用flask服务进行表格图片识别,PDF识别。利用paddleOCR检测模型检测并识别文字,然后利用opencv图像处理中FLD直线检测算法进行框线检测,并结合规则得到表格结构化信息,并根据结构化信息讲识别结果重现为Excel。其中paddleOCR模型均被本人转成ONNX推理加速。因代码于本人工作中实现,无法取出,但均为可复现代码。故没有代码截图。
评论