赞
踩
Transformer是继mlp,cnn,rnn后的又一类神经网络模型,自提出以来,已经广泛应用与自然语言处理(NLP)与计算机视觉(CV)领域。作为从业者和工程师,又必要对这一前沿技术进行跟进学习。
互联网上关于Transformer的介绍和讲解多如牛毛,但是真正引人入胜的文章寥寥无几,大多数文章要么是低级的重复抄袭,不堪卒读。要么是只介绍Transformer中的一个小点,读来有种只见树木不见森林的感觉,容易使读者感觉盲人摸象,似是而非。还有一些非常不错的文章,但是又缺乏对应的可供试手的代码。
鉴于此,特写这个手撸Transformer的教程,既希望能帮助其它同学学习,也是对自己最近学习Transformer的一个总结。
本教程以jupyter notebook的形式发布,将理论介绍与对应代码相结合,方便读者学习参考。
在本教程中,将会介绍Transformer中的基本概念,然后逐模块地给出一个Transformer模型的实现,并在一个机器翻译数据集上训练Transformer,便于读者获得一个直观的感受。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。