基于食品饮料等领域的社媒和电商文本数据,通过广告识别算法和码表规
则过滤掉无关数据。然后通过新概念提取算法识别出每条文本中的实体,并通过关系
识别算法识别有关系的实体对,通过归一化工具聚类算法制作归一化码表对所有实体
进行归一化和黑名单过滤。然后通过榜单算法计算每个趋势(实体)对应在最近一年内
的上升指数、热度指数、每个月声量等维度数据。计算有关系的实体对之间的共现声
量、相关性指数等关联关系指标,并通过品牌品类库结合关联关系计算三个趋势之间
的组合概念,并通过电商的组合概念比较(bert-embedding)得到每个组合概念的新
颖性。结合对应领域的三元组分析识别出对应的一级二级维度、特征词、情感词等。
点击空白处退出提示












评论