项目内容:构建美国科学研究系统的知识图谱,由NIH和NSF数据构建网络,并用复杂网络理论对合作模式进行挖掘。
项目技术:Schema设计、ER图、Scrapy爬虫、知识图谱、Neo4j、复杂网络分析(节点中心性、聚类系数)、Mediawiki
项目成果:爬取数据后,构建极大连通子图包含52883条12年NIH数据、47949条14年NSF数据,数据融合后总计100832条数据43个特征,并绘制4类实体UML类图、Protege本体图,构建含71489个节点86177个关系的Neo4j知识图谱,并通过复杂网络统计指标分析,揭示跨机构合作模式,通过MediaWiki展示在SMW平台
点击空白处退出提示
评论