赞
踩
NLP-词向量-发展:
词向量的维数为整个词汇表的长度,对于每个词,将其对应词汇表中的位置置为1,其余维度都置为0。
缺点是:
缺点:在词对推理任务上表现特别差;可解释性差;
词共现矩阵
神经网络将词汇表中的词作为输入,输出一个低维的向量表示,然后使用反向传播优化参数。
生成词向量的神经网络模型分为两种:
Word2Vec:其输出是单词同时出现的概率分布(共现概率分布)
GLove:相比单词同时出现的概率(共现概率分布),单词同时出现的概率的比率能够更好地区分单词。
官方glove: https://github.com/stanfordnlp/GloVe,C实现
Python 实现: https://github.com/maciejkula/glove-python
安装
pip install glove_python
特征提取器:
单/双向语言模型:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。