项目背景:医疗行业中存在大量的病人就诊病历,如何利用新技术(比如知识图谱)将关键数据抽取出来,构建专业就诊数据库,以方便新的病人更加便捷的问诊,目前是一个比较热门的话题。
项目描述:数据采集自网上数据,数据内容包括疾病、表现症状、治疗方案、治疗科室、治疗药物、治疗费用、推荐食物、禁忌食物等等。
● 利用Neo4j图数据库对数据构建相关节点,如疾病节点、表现症状、药物节点等等,并构建相关关系。
● 将相关节点的数据进行归类汇总,利用BERT对各个类型的数据进行分类训练,构建分类模型。同时将各个分类的节点数据构建AC自动机,便于文本快速检索与查询。
● 将用户输入信息导入分类模型进行识别,了解当前用户咨询的问题属于哪个类别,然后对在对应的AC自动机下进行快速检索,检索后再提交到Neo4j图数据库查找相关节点,最终给出合适的答案。