主要任务就是负责滴滴搜索中的query纠错,我们使用了一种GAN对抗网络,其中生成模型主要是为了生成更加隐蔽的错误数据,然后还有一个判别器主要是为了提高模型对整个query的检测能力,纠错的主体架构是由一个GAN网络加上一个bert和ngram结构组成,我们在bert结尾加了一层线层用来判其中GAN和bert主要负责检测错误单词,ngram负责纠错,其中我们为了使得纠正之后的数据更加符合用户的意图,我们去掉了单个单词词频对结果的影响,然后我们还会从键盘位置对满足条件的值适当的提高权重,以达到提高模型的纠正准确率。目前正在打算发一篇关于纠错的论文正在筹备当中。
点击空白处退出提示
评论