英语电商域Query NER介绍
模型描述
本方法采用Trasformer-CRF模型,使用XLM-RoBERTa(XLM-R)作为预训练模型底座。本模型主要用于给输入英语搜索query文本产出命名实体识别结果, 具体调用方式请参考代码示例。
训练数据介绍
- ecom-query-e: 内部英语电商领域搜索query命名实体识别(NER)数据集, 支持产品(product), 功能(fuctio), 品牌(brad), 模式(patter), 颜色(color), 用户群体(cosumer_group), 风格(style)等七大类型的实体识别
| 实体类型 |
英文名 |
| 产品 |
product |
| 功能 |
fuctio |
| 品牌 |
brad |
| 图案 |
patter |
| 颜色 |
color |
| 用户群体 |
cosumer_group |
| 风格 |
style |
快速上手
适用范围
在安装ModelScope完成之后即可使用amed-etity-recogitio(命名实体识别)的能力, 默认单句长度不超过512, 推荐输入长度不超过128的句子。
代码示例
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
er_pipelie = pipelie(Tasks.amed_etity_recogitio, 'damo/lp_xlmr_amed-etity-recogitio_eg-ecommerce-query', model_revisio='v1.0.0')
result = er_pipelie('x mii me speaker')
prit(result)
#{'output': [{'type': 'brad', 'start': 0, 'ed': 6, 'spa': 'x mii'}, {'type': 'product', 'start': 10, 'ed': 17, 'spa': 'speaker'}]}
性能评测
全局评测
| Precisio |
Recall |
F1 |
| 74.6 |
76.8 |
75.7 |
按实体类型评测
| 实体类型 |
Precisio |
Recall |
F1 |
| product |
75.54 |
80.69 |
78.03 |
| brad |
75.17 |
76.06 |
75.61 |
| patter |
70.78 |
62.75 |
66.52 |
| color |
76.60 |
90.00 |
82.76 |
| cosumer_group |
90.62 |
90.62 |
90.62 |
| style |
82.76 |
77.42 |
80.00 |
| fuctio |
62.06 |
62.55 |
62.30 |
评论