本项目主要提供智能翻译功能的引擎。
实现原理是利用Transformer架构通过深度学习进行语言翻译。
和流行的大语言模型翻译的主要区别在于:
1.推理速度快,参数量小,可以在端侧实行推理
2.不像生成式模型大多只用了Transformer的解码器部分。此项目同时使用编码器和解码器,环顾整个句子的前后文字关系进行翻译,提高翻译准确度
本人主要对此项目的神经网络模型进行设计编写和优化。
点击空白处退出提示
本项目主要提供智能翻译功能的引擎。
实现原理是利用Transformer架构通过深度学习进行语言翻译。
和流行的大语言模型翻译的主要区别在于:
1.推理速度快,参数量小,可以在端侧实行推理
2.不像生成式模型大多只用了Transformer的解码器部分。此项目同时使用编码器和解码器,环顾整个句子的前后文字关系进行翻译,提高翻译准确度
本人主要对此项目的神经网络模型进行设计编写和优化。




评论