项目旨在解决简体繁体字转换的问题,包括文字段落转换、文件转换和图片识别转换。主要应用场景是办公,教育和阅读。
点击空白处退出提示
语言技术
Python、Flask、Kotlin、TypeScript系统类型
Android应用、HarmonyOS应用行业分类
企业服务、教育校园
项目旨在解决简体繁体字转换的问题,包括文字段落转换、文件转换和图片识别转换。主要应用场景是办公,教育和阅读。
项目包括文字段落转换模块、文件转换模块和图片识别转换模块
- 文字段落转换模块,是由用户输入或粘贴要转换的文字内容,然后轻触“简转繁”或“繁转简”按钮,由软件进行简繁转换。转换结果可以复制到剪贴板或发送到微信
- 文件转换模块,支持多种常见文件格式,例如 txt, doc, docx, epub, pdf。由用户选中要转换的文件,软件显示文件预览,用户可以然后轻触“简转繁”或“繁转简”按钮,软件会转换整个文件的内容,并保持原本格式不变。转换结果可以发送到微信
- 识图转换模块,支持jpg和png格式的图片文件,由用户选中要转换的文件,软件显示图片预览,用户可以然后轻触“简转繁”或“繁转简”按钮,软件会识别并转换整个图片里的文字内容,并保持原本格式不变。转换结果可以发送到微信
本项目由本公司3名开发者合作完成。本人是技术总负责人和产品经理。
项目中的难点:
- docx和doc文件的读取. doc文件是微软的专有格式,非开源,很难在安卓设备上直接读取。我们使用了aspose公司的SDK来读取和转换doc文件
- pdf文件的识别和转换:有很多pdf文件内部是图片,不是文字。需要先判断用户pdf文件内部是文字为主还是图片为主。如果是文字型pdf,我们先把文件上传到公司服务器,然后在服务器上使用开源库将pdf文件转换成html网页文件,再下载回用户的设备上。然后以html文件的格式进行简繁转换,再上传回服务器上,在服务器上重新转换回pdf文件,再下载回用户设备上。如果是图片为主的pdf文件,我们先进行逐页图片文字识别,再进行文字简繁转换,再将转换结果上传到服务器,在服务器上使用开源库重新打包成pdf,并下载回用户设备
- 图片文字识别:我们采用了腾讯的文字识别API来进行图片文字识别






评论