交互式机器翻译(Iteractive Machie Traslatio)的输入为源文和译文前缀,输出为后续的译文,可以提高后续译文的翻译质量。当输入译文前缀的最后一个词不完整时,模型会输出当前词及后续译文。本模型基于CSANMT连续语义增强机器翻译模型。 该模型利用输入译文的前缀作为Decoder的输入,使用强制解码Beam Search算法,预测后续译文。当输入译文前缀的最后一个词不完整时,生成一个匹配词典中每个单词前缀的MASK向量,通过这个MASK向量影响影响第一个的预测结果。 该模型适用于的交互式机器翻译场景,输入为源文及译文前缀,输出为的后续译文。 在ModelScope框架上,提供输入源文和译文前缀,即可通过简单的Pipelie调用来使用。
参考CSANMT连续语义增强机器翻译模型训练数据及流程。 参考CSANMT连续语义增强机器翻译数据评估结果。 如果你觉得这个该模型对有所帮助,请考虑引用下面的相关的论文:交互式机器翻译模型介绍
温馨提示
模型描述
期望模型使用方式以及适用范围
如何使用
使用效果展示
代码范例
# Chiese-to-Eglish
# 温馨提示: 使用pipelie推理及在线体验功能的时候,尽量输入单句文本,如果是多句长文本建议人工分句!!!
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
iput_sequece = '声明补充说,沃伦的同事都深感震惊,并且希望他能够投案自首。'
iput_prefix = 'The statemet ad'
pipelie_is = pipelie(task=Tasks.traslatio, model='damo/lp_imt_traslatio_zh2e')
# 以 '<PREFIX_SPLIT>' 拼接源文和译文前缀
outputs = pipelie_is(iput_sequece + '<PREFIX_SPLIT>' + iput_prefix)
prit(outputs['traslatio']) # 'added that Warre's colleagues were deeply shocked ad expected him to tur himself i.'
模型局限性以及可能的偏差
训练数据及流程
模型训练
# Chiese-to-Eglish
from modelscope.traiers.lp import CsamtTraslatioTraier
traier = CsamtTraslatioTraier(model="damo/lp_imt_traslatio_zh2e")
traier.trai()
数据评估及结果
论文引用
@iproceedigs{wei-etal-2022-learig,
title = {Learig to Geeralize to More: Cotiuous Sematic Augmetatio for Neural Machie Traslatio},
author = {Xiagpeg Wei ad Heg Yu ad Yue Hu ad Rogxiag Weg ad Weihua Luo ad Rog Ji},
booktitle = {Proceedigs of the 60th Aual Meetig of the Associatio for Computatioal Liguistics, ACL 2022},
year = {2022},
}
点击空白处退出提示
评论