自然语言处理(NLP)入门——Transformer详解(1)_transformers的自然语言处理(nlp)入门

作者：小小林熬夜学编程 | 2024-04-03 17:21:32

踩

transformers的自然语言处理(nlp)入门

输入部分

文本嵌入层:
- 作用: 为了在更高维度的语义空间中捕捉词汇之间的联系
- 代码实现:
  - Embeddings: 在源文本嵌入和和目标文本嵌入层是共享
  - 在实现的过程中embedding之后的结果*维度的开方, 目的是: 1.为了是嵌入层数值的量级和后面位置编码器的数值量级达到一个量级上, 2. 为了加快模型的训练过程
位置编码器
- 作用: Transformer在信息提取的过程中, 将位置信息缺失了, 为了添加位置信息, 所以在此处要添加位置编码器.
- 使用的函数: 正余弦函数, 在偶数为上进行正弦值的插入, 在奇数位置上进行余弦值的插入
- 注意点: 这里的位置编码器可以换成其他的函数形式, 或是在网络中进行动态学习.(了解即可)

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/356247