当前位置:   article > 正文

【NLP】简单神经网络_nlp与神经网络

nlp与神经网络
  1. 文本表示:从one-hot到word2vec。
    1.1 词袋模型:离散、高维、稀疏。
    1.2 分布式表示:连续、低维、稠密。word2vec词向量原理并实践,用来表示文本。

1. Word vectors

把词变成计算机看的懂的语言就是词向量。
看这里:Understanding word vectors

1.1 传统词向量

1.1.1 one-hot

最简单的词向量之一叫one-hot encoded vectors。
譬如,有一组词{magic, dragon, king, queen},用one-hot表示:
在这里插入图片描述

For high-cardinality variables — those with many unique categories — the dimensionality of the transformed vector becomes unmanageable.
The mapping is completely uninformed: “similar” categories are not placed closer to each other in embedding space.

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/910219
推荐阅读
相关标签
  

闽ICP备14008679号