Word2vec 的用法_word2vec输出词model.wv

作者：知新_RL | 2024-05-25 08:44:43

踩

word2vec输出词model.wv


model.wv.key_to_index #1.获得所有词汇组
 
model.wv['爱情'] # 2.得到词的向量
 
model.wv.similarity('爱情', '疯狂') #0.16419926# # 3.计算两个词之间的余弦相似度
 
# 4.找出不太合群的词
model.wv.doesnt_match("疯狂 痛苦 包含".split()) #这个结果是包含，但是我发现有时候另外一些词并不能正确判断，所以估计还是语料库不够大
 
# 5.返回与爱情最近的词和相似度
model.wv.similar_by_word("爱情", topn=10, restrict_vocab=30)
# 其中的参数restrict_vocab ，它是可选的整数，它限制了向量的范围，搜索最相似的值。 例如，restrict_vocab = 10000会，只检查词汇顺序中的前10000个词汇向量。
 
 
#6.查看词向量的维度,109个词汇，维度为100
model.wv.vectors.shape
 
# 7.接近词汇A更甚于词汇B接近词汇A的【所有】词汇,按相似度由高到低降序排列
model.wv.closer_than('迷恋','爱情')

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/知新_RL/article/detail/621358