项目分为三部分文档接收,文档转换,文档识别,文档解析
1.文档接收,判断文件类型,是Excel、pdf等。还有内容的判断,比如:是文字就解析;是图片就走识别;
2.文档转换,对文字类型,都转换成html再JS解析文件;
3.文档识别,图片内容直接调用百度接口进行识别,再用python解析就行;
4.文档解析,js解析html,python直接解析通过百度识别出来的内容
我负责js解析,python调试适配,部分代码的完成
点击空白处退出提示
项目分为三部分文档接收,文档转换,文档识别,文档解析
1.文档接收,判断文件类型,是Excel、pdf等。还有内容的判断,比如:是文字就解析;是图片就走识别;
2.文档转换,对文字类型,都转换成html再JS解析文件;
3.文档识别,图片内容直接调用百度接口进行识别,再用python解析就行;
4.文档解析,js解析html,python直接解析通过百度识别出来的内容
我负责js解析,python调试适配,部分代码的完成
评论