当前位置:   article > 正文

“什么是Word Embedding(词嵌入)”的个人理解_嵌入embedding的来源

嵌入embedding的来源

首先粘贴一下Wiki英文的定义:

Word embedding is the collective name for a set of language modeling and feature learning techniques in natural language processing (NLP) where words or phrases from the vocabulary are mapped to vectors of real numbers. Conceptually it involves a mathematical embedding from a space with one dimension per word to a continuous vector space with a much lower dimension.

它的意思是说,Word Embedding是一系列语言NLP中语言模型和特征模型的总称,在数学上牵涉到将每个单词一个维度的高维向量映射到一个低维连续向量的过程。

之所以叫Embedding(“嵌入”),是因为Embedding在数学上的定义:

In mathematics, an embedding (or imbedding[1]) is one instance of some mathematical structure contained within another instance, such as a group that is a subgroup.

When some object X is said to be embedded in another object Y, the embedding is given by some injective and structure-preserving map f : X → Y. The precise meaning of "structure-preserving" depends on the kind of mathematical structure of which X and Y are instances. In the terminology of category theory, a structure-preserving map is called a morphism.

主要表征一个结构通过映射而包含到另一个结构中,比如,我们可以把整数“嵌入”进有理数之中。显然,整数是一个集合,同时它又是有理数的一个子集。整数集合中的每个整数,在有理数集合中都能找到一个唯一的对应(其实就是它本身)。同时,整数集合中的每个整数所具有的性质,在有理数中同样得到了保持。同理,我们也可以把有理数“嵌入”到实数中去。
 

参考链接:

英文维基

https://en.wikipedia.org/wiki/Word_embedding

最后一段,Embedding的例子的来源

https://blog.csdn.net/baimafujinji/article/details/77836142

 

本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号