简繁转换产品系统

我要开发同款
34阅读

技术信息

作品详情

行业场景

项目旨在解决简体繁体字转换的问题,包括文字段落转换、文件转换和图片识别转换。主要应用场景是办公,教育和阅读。

功能介绍

项目包括文字段落转换模块、文件转换模块和图片识别转换模块
- 文字段落转换模块,是由用户输入或粘贴要转换的文字内容,然后轻触“简转繁”或“繁转简”按钮,由软件进行简繁转换。转换结果可以复制到剪贴板或发送到微信
- 文件转换模块,支持多种常见文件格式,例如 txt, doc, docx, epub, pdf。由用户选中要转换的文件,软件显示文件预览,用户可以然后轻触“简转繁”或“繁转简”按钮,软件会转换整个文件的内容,并保持原本格式不变。转换结果可以发送到微信
- 识图转换模块,支持jpg和png格式的图片文件,由用户选中要转换的文件,软件显示图片预览,用户可以然后轻触“简转繁”或“繁转简”按钮,软件会识别并转换整个图片里的文字内容,并保持原本格式不变。转换结果可以发送到微信

项目实现

本项目由本公司3名开发者合作完成。本人是技术总负责人和产品经理。
项目中的难点:
- docx和doc文件的读取. doc文件是微软的专有格式,非开源,很难在安卓设备上直接读取。我们使用了aspose公司的SDK来读取和转换doc文件
- pdf文件的识别和转换:有很多pdf文件内部是图片,不是文字。需要先判断用户pdf文件内部是文字为主还是图片为主。如果是文字型pdf,我们先把文件上传到公司服务器,然后在服务器上使用开源库将pdf文件转换成html网页文件,再下载回用户的设备上。然后以html文件的格式进行简繁转换,再上传回服务器上,在服务器上重新转换回pdf文件,再下载回用户设备上。如果是图片为主的pdf文件,我们先进行逐页图片文字识别,再进行文字简繁转换,再将转换结果上传到服务器,在服务器上使用开源库重新打包成pdf,并下载回用户设备
- 图片文字识别:我们采用了腾讯的文字识别API来进行图片文字识别

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论