中小企业行政、财务人员日常需要重复处理海量 Excel 表格,手工整理数据耗时易出错。基于 AI 快速编写自动化脚本,实现表格批量合并、数据筛选、格式转换,替代人工重复操作,大幅降低企业办公人力时间成本,轻量化工具按需定制、交付速度快。
点击空白处退出提示
中小企业行政、财务人员日常需要重复处理海量 Excel 表格,手工整理数据耗时易出错。基于 AI 快速编写自动化脚本,实现表格批量合并、数据筛选、格式转换,替代人工重复操作,大幅降低企业办公人力时间成本,轻量化工具按需定制、交付速度快。
脚本支持多 Excel 文件批量读取、数据条件筛选、重复数据去重、单元格格式统一、报表自动导出,可自定义匹配企业专属表格字段;AI 生成基础逻辑后人工重构优化代码,无 GPL 传染性开源片段,提供可视化简易运行界面,客户本地电脑直接运行使用,无需部署服务器,支持根据企业需求新增数据处理规则迭代。
AI读取dota文件夹下的文档,理解并生成文档名字,交由大数据分析,输出用户想要的结果。
本人独立完成智能文档助手全流程开发,落地 ReAct 智能体结合 RAG 检索增强的文档问答系统。
个人负责工作:基于 LangChain 0.2.x 搭建 ReAct Agent 架构,封装 7 套业务工具并打通完整调用链路;开发多格式文档预处理模块,支持 PDF、Excel、Word 自动解析与智能重命名;基于 ChromaDB 实现 RAG 向量检索问答,优化文档检索工具召回精度;使用 Flask 搭建 Web 后端,开发任务实时进度展示功能,修复 Windows 环境中文编码乱码问题;解决大模型循环推理程序崩溃故障,设计按文件大小自适应的动态文本读取截断方案。
技术架构:采用 LangChain 0.2.x+Flask+ChromaDB 向量库 + 阿里云百炼大模型 API,以 ReAct 推理框架 + RAG 检索增强为核心,通过 StructuredTool 标准化封装全部工具。
项目亮点:自定义动态文档处理策略,10MB 以内文件采用 50 行标准提取规则,大文件自动切换 10 行精简模式,平衡信息完整度与处理效率;智能体可自主多轮推理、自动调度工具完成复杂问答;Web 页面搭配进度条与步骤指示器,可视化展示文档处理全流程进度。
解决核心难点:针对中文场景调优向量语义匹配效果,完善 ReAct 智能体循环终止判定逻辑,权衡超大 PDF/Excel 文件文本截断的性能与问答准确度,保障系统稳定处理各类办公文档检索问答业务。

评论