对于同样的数据,从不同的维度进行相似度比较:1:tf-idf,基础的文本相似度计算方法。2:余弦相似度,将词语embedding成一定维度的向量,利用余弦计算方法判断相似性。3:对于nlp,有论文研究表明,将语句中相同的部分与不同的部分进行权重分配,然后进行计算,可以得到更好的效果,故采用了论文所研究的方法,进行句子的相似度比较。
评论