演示地址https://zhuanlan.zhihu.com/p/467874444
本项目从算法原理的角度详细介绍了transformer模型。主要是限制介绍了注意力机制与掩码注意力机制的原理与实现。并从多个角度解释了它的有效性原理。
评论
评论