想比较传统的消歧方法(如:基于词典的消歧),本文通过上下文的频繁项挖掘进行判别。将环境信息作为可信证据,包括特征选择、参数优化和集成学习等相关技术。
项目思路:手动标记部分训练示例或一小部分确定的规则,用于训练监督方法的初始分类器。然后让分类器用于未标记的语料库,以获取一个更大的训练集。这个过程重复进行,每个新分类器都在一个逐渐变大的训练语料库上进行训练,直到整个语料库被标记,或者达到给定的最大迭代次数。
效果如作品图片所示:
点击空白处退出提示
开源地址
https://www.gitlink.org.cn/xDong/WSD-based-on-Frequent-ItemSets授权协议
GPL许可
想比较传统的消歧方法(如:基于词典的消歧),本文通过上下文的频繁项挖掘进行判别。将环境信息作为可信证据,包括特征选择、参数优化和集成学习等相关技术。
项目思路:手动标记部分训练示例或一小部分确定的规则,用于训练监督方法的初始分类器。然后让分类器用于未标记的语料库,以获取一个更大的训练集。这个过程重复进行,每个新分类器都在一个逐渐变大的训练语料库上进行训练,直到整个语料库被标记,或者达到给定的最大迭代次数。
效果如作品图片所示:
评论