小艺文档助理(文档解析)产品系统

我要开发同款
LiuYanming2026年05月17日
15阅读

技术信息

语言技术
PythonGo
系统类型
HarmonyOS应用算法模型
行业分类
人工智能

作品详情

行业场景

华为小艺文档助理的RAG流程需要从用户上传的多种格式的文档中提取结构化数据或内容,构建并存储语义化索引,提供准确、细致的数据支撑。

功能介绍

该项目使用了Python和Go两种开发语言,核心模块有大纲提取、正文抽取、版面分析、图片解析、表格解析、混合重排等。
其中任务调度和工具调用由Go语言实现,具体的解析算法由Python实现。

项目实现

通过Pipeline并行的方案减少模块间等待时延、使用任务队列的方式按页分发解析任务、索引异步构建入库等优化手段,将解析时延从60+秒优化至6.49秒,成功率提升至95%+,摘要类意图Query的端到端耗时减少72%。

同时还针对不同场景提供了快、慢、深解析等不同程度的解析策略。

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论