（安卓APP、鸿蒙APP）简繁转换_系统开发案例-程序员客栈

技术信息

语言技术
Python、Flask、Kotlin、TypeScript系统类型
Android应用、HarmonyOS应用行业分类
企业服务、教育校园

作品详情

行业场景

项目旨在解决简体繁体字转换的问题，包括文字段落转换、文件转换和图片识别转换。主要应用场景是办公，教育和阅读。

功能介绍

项目包括文字段落转换模块、文件转换模块和图片识别转换模块
- 文字段落转换模块，是由用户输入或粘贴要转换的文字内容，然后轻触“简转繁”或“繁转简”按钮，由软件进行简繁转换。转换结果可以复制到剪贴板或发送到微信
- 文件转换模块，支持多种常见文件格式，例如 txt, doc, docx, epub, pdf。由用户选中要转换的文件，软件显示文件预览，用户可以然后轻触“简转繁”或“繁转简”按钮，软件会转换整个文件的内容，并保持原本格式不变。转换结果可以发送到微信
- 识图转换模块，支持jpg和png格式的图片文件，由用户选中要转换的文件，软件显示图片预览，用户可以然后轻触“简转繁”或“繁转简”按钮，软件会识别并转换整个图片里的文字内容，并保持原本格式不变。转换结果可以发送到微信

项目实现

本项目由本公司3名开发者合作完成。本人是技术总负责人和产品经理。
项目中的难点：
- docx和doc文件的读取. doc文件是微软的专有格式，非开源，很难在安卓设备上直接读取。我们使用了aspose公司的SDK来读取和转换doc文件
- pdf文件的识别和转换：有很多pdf文件内部是图片，不是文字。需要先判断用户pdf文件内部是文字为主还是图片为主。如果是文字型pdf，我们先把文件上传到公司服务器，然后在服务器上使用开源库将pdf文件转换成html网页文件，再下载回用户的设备上。然后以html文件的格式进行简繁转换，再上传回服务器上，在服务器上重新转换回pdf文件，再下载回用户设备上。如果是图片为主的pdf文件，我们先进行逐页图片文字识别，再进行文字简繁转换，再将转换结果上传到服务器，在服务器上使用开源库重新打包成pdf,并下载回用户设备
- 图片文字识别：我们采用了腾讯的文字识别API来进行图片文字识别