赞
踩
- model.wv.key_to_index #1.获得所有词汇组
-
- model.wv['爱情'] # 2.得到词的向量
-
- model.wv.similarity('爱情', '疯狂') #0.16419926# # 3.计算两个词之间的余弦相似度
-
- # 4.找出不太合群的词
- model.wv.doesnt_match("疯狂 痛苦 包含".split()) #这个结果是包含,但是我发现有时候另外一些词并不能正确判断,所以估计还是语料库不够大
-
- # 5.返回与爱情最近的词和相似度
- model.wv.similar_by_word("爱情", topn=10, restrict_vocab=30)
- # 其中的参数restrict_vocab ,它是可选的整数,它限制了向量的范围,搜索最相似的值。 例如,restrict_vocab = 10000会,只检查词汇顺序中的前10000个词汇向量。
-
-
- #6.查看词向量的维度,109个词汇,维度为100
- model.wv.vectors.shape
-
- # 7.接近词汇A更甚于词汇B接近词汇A的【所有】词汇,按相似度由高到低降序排列
- model.wv.closer_than('迷恋','爱情')

赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。