新材料研发具有“研发周期长、试错成本高、知识碎片化严重”的典型痛点:配方/工艺/表征/性能数据分散在论文、专利、实验报告、仪器数据与会议纪要中,研究人员检索与复现困难,跨团队知识难以沉淀,导致重复实验与路径选择失误。为提升材料筛选效率与研发决策质量,本项目构建面向新材料方向的企业级知识库与智能问答平台,沉淀内部数据并融合外部文献知识,实现从“资料检索”到“研发辅助决策”的闭环,降低试错成本、缩短研发周期,提升研发协同效率与知识资产复用率。
点击空白处退出提示
新材料研发具有“研发周期长、试错成本高、知识碎片化严重”的典型痛点:配方/工艺/表征/性能数据分散在论文、专利、实验报告、仪器数据与会议纪要中,研究人员检索与复现困难,跨团队知识难以沉淀,导致重复实验与路径选择失误。为提升材料筛选效率与研发决策质量,本项目构建面向新材料方向的企业级知识库与智能问答平台,沉淀内部数据并融合外部文献知识,实现从“资料检索”到“研发辅助决策”的闭环,降低试错成本、缩短研发周期,提升研发协同效率与知识资产复用率。
平台提供从数据接入、知识构建到智能检索与对话的全流程能力: 1)用户与权限:用户系统、角色权限控制、数据隔离与访问审计;
2)知识库管理:知识库创建/删除、数据集管理、增量更新、版本与状态管理;
3)新材料专用文本处理:支持论文/专利/报告等多格式解析、结构化抽取(材料体系、成分配比、工艺参数、表征方法、性能指标)、去噪清洗与分段切片;
4)检索增强:基于向量库的语义检索+关键词/条件过滤的混合检索,提升专业术语与配方/参数场景下的召回与准确度;
5)AI for Science:面向研发问题的总结归纳、对比分析、实验方案建议、结果解释与引用溯源;
6)对话与Agent:融合AI对话、工具/Agent调用(检索、数据抽取、报告生成等)、多轮对话管理与人工介入审核,形成可控、可追溯的研发辅助流程。
本项目为“企业级AI知识库(新材料方向)”综合平台,目标是将内部研发资料与外部文献转化为可检索、可对话、可追溯的知识资产,为材料设计、工艺优化与实验决策提供支持。我主要负责知识库体系的整体搭建与落地:包括知识入库流程设计、文本解析与清洗切片策略、向量化与索引构建、检索链路与RAG接口、以及后端API服务输出与稳定性保障。技术栈方面采用 Python 作为主要开发语言,Milvus 构建向量检索与相似度召回,MySQL 存储业务元数据与权限信息;使用 Mineru 完成文档解析/结构化抽取,基于 LangGraph 编排多步骤Agent工作流与对话管理;通过 Kafka 实现异步任务与增量更新管道,保障大规模文档导入、索引重建与在线查询的解耦与高吞吐。平台最终实现多源数据统一管理、专业领域检索增强与可控智能问答,支撑新材料研发效率提升。




评论