中小企业内部文档(员工手册、产品FAQ、技术架构设计)分散在本地和共享目录,员工检索效率低,新人上手慢。本项目解决企业内部知识检索难的痛点:管理员上传文档后系统自动分段入库,员工用自然语言提问即可获得带原文引用的精准回答,替代传统关键词搜索。
点击空白处退出提示
中小企业内部文档(员工手册、产品FAQ、技术架构设计)分散在本地和共享目录,员工检索效率低,新人上手慢。本项目解决企业内部知识检索难的痛点:管理员上传文档后系统自动分段入库,员工用自然语言提问即可获得带原文引用的精准回答,替代传统关键词搜索。
系统包含三大功能模块:①文档管理后台——支持 TXT、Markdown 文件批量上传,自动智能分段与入库;②智能问答对话台——自然语言输入问题,AI 结合知识库内容生成回答,并标注引用原文段落和处理来源;③知识库仪表盘——文档数量、文本块统计等可视化信息展示。核心交互为对话式检索,用户像与人聊天一样查询企业内部任何文档内容,支持中英文混合查询。
我负责全栈架构设计与开发。前端使用 Next.js 14 + TypeScript + Tailwind CSS 构建管理后台与聊天界面,后端采用 Next.js API Routes + Node.js 实现 RESTful 接口,数据存储基于本地 JSON 文件的轻量索引引擎。技术亮点:①中文分词采用字符级 unigram + bigram 组合策略,让"账户怎么注册"能精确匹配"如何注册账户"等变体问法;②零外部向量数据库依赖,纯本地检索降低部署成本。核心难点:解决 DeepSeek API 不支持 embedding 端点的问题,自研关键词检索替代向量语义搜索,同时保证中文查询的召回率;处理 PowerShell/Node.js 跨工具链的中文 UTF-8 编码一致性问题。



评论