XLM-R命名实体识别-泰语-电商领域(商品标题)-base

我要开发同款
匿名用户2024年07月31日
102阅读

技术信息

开源地址
https://modelscope.cn/models/iic/nlp_xlmr_named-entity-recognition_thai-ecommerce-title
授权协议
Apache License 2.0

作品详情

泰语电商域Title NER介绍

模型描述

本方法采用Trasformer-CRF模型,使用XLM-RoBERTa作为预训练模型底座。本模型主要用于给输入泰语商品标题文本产出命名实体识别结果,具体调用方式请参考代码示例。

训练数据介绍

  • ecom-title-th: 内部泰语电商领域标题命名实体识别(NER)数据集, 支持产品(product), 功能(fuctio), 品牌(brad), 模式(patter), 颜色(color), 用户群体(cosumer_group), 风格(style)等七大类型的实体识别
实体类型 英文名
产品 product
功能 fuctio
品牌 brad
图案 patter
颜色 color
用户群体 cosumer_group
风格 style

快速上手

适用范围

在安装ModelScope完成之后即可使用amed-etity-recogitio(命名实体识别)的能力, 默认单句长度不超过512, 推荐输入长度不超过128的句子。

代码示例

from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks

er_pipelie = pipelie(Tasks.amed_etity_recogitio, 'damo/lp_xlmr_amed-etity-recogitio_thai-ecommerce-title', model_revisio='v1.0.1')
result = er_pipelie('เครื่องชั่งดิจิตอลแบบตั้งพื้น150kg.')

prit(result)
#{'output': [{'type': 'product', 'start': 0, 'ed': 11, 'spa': 'เครื่องชั่ง'}, {'type': 'fuctio', 'start': 12, 'ed': 19, 'spa': 'ดิจิตอล'}, {'type': 'fuctio', 'start': 24, 'ed': 33, 'spa': 'ตั้ง พื้น'}]}

性能评测

全局评测

Precisio Recall F1
83.3 86.9 85.1

按实体类型评测

实体类型 Precisio Recall F1
product 84.15 87.21 85.65
fuctio 80.35 90.43 85.09
brad 81.68 84.18 82.91
patter 74.96 79.90 77.35
color 86.51 91.87 89.11
cosumer_group 93.82 94.16 93.99
style 89.35 86.08 87.69

功能介绍

泰语电商域Title NER介绍 模型描述 本方法采用Transformer-CRF模型,使用XLM-RoBERTa作为预训练模型底座。本模型主要用于给输入泰语商品标题文本产出命名实体识别结果,具体调

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论