基于大数据的智能数据采集与分析处理平台-PDF解析提取模块

我要开发同款
能下锅的羊2024年04月24日
418阅读

作品详情

2.PDF解析提取模块对国内上市公司(包含股票、基金、债券等)披露的PDF、EXCEL、WORD、TXT、HTML等(日常披露和定期报告)文件进行解析/提取关键数据,根据指定规则转换为结构化数据,调用基础录入功能接口,将所需数据插入到指定数据库中。提高数据处理智能化,减少人工干预,提高数据处理效率。该模块采用Visual Studio 2017+.NET Framework 4.5+WCF进行开发3.自动监控入库程序程序采用FileSystemWatcher控件,自动发现指定目录下的文件;根据文件名、存放目录等规则,对文件进行初步分类并筛选,然后进行格式转换处理,转换完成后调用PDF解析提取模块,对所需数据进行解析并提取;提取后通过接口调用基础录入功能模块,将所需数据进行入库。该模块采用Visual Studio 2017+.NET Framework 4.5+WinForm进行开发
查看全文
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论