对于同样的数据,从不同的维度进行相似度比较:
1:tf-idf,基础的文本相似度计算方法。
2:余弦相似度,将词语embedding成一定维度的向量,利用余弦计算方法判断相似性。
3:对于nlp,有论文研究表明,将语句中相同的部分与不同的部分进行权重分配,然后进行计算,可以得到更好的效果,故采用了论文所研究的方法,进行句子的相似度比较。
点击空白处退出提示
对于同样的数据,从不同的维度进行相似度比较:
1:tf-idf,基础的文本相似度计算方法。
2:余弦相似度,将词语embedding成一定维度的向量,利用余弦计算方法判断相似性。
3:对于nlp,有论文研究表明,将语句中相同的部分与不同的部分进行权重分配,然后进行计算,可以得到更好的效果,故采用了论文所研究的方法,进行句子的相似度比较。
评论