当前位置:   article > 正文

利用腾讯词向量计算相似度_腾讯词相似度

腾讯词相似度
from gensim.models import KeyedVectors
from annoy import AnnoyIndex
from numpy import dot
from gensim import utils, matutils
import numpy as np

keyword_type={}
word_emb = {}
#loadEmbedding():
wv_from_text = KeyedVectors.load_word2vec_format("Tencent_AILab_ChineseEmbedding.txt", binary=False)
for key in wv_from_text.vocab.keys():
    word_emb[key]=wv_from_text[key]
print dot(matutils.unitvec(wv_from_text[w1]), matutils.unitvec(wv_from_text[w2]))
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

matutils.unitvec将一维array归一化

input_vector = np.random.uniform(size=(10,))
#array([0.39128945, 0.45510596, 0.42401018, 0.33814469, 0.31290301,
#	       0.15597097, 0.74319954, 0.60262496, 0.30601651, 0.53778863])
unit_vector = matutils.unitvec(input_vector) 
  • 1
  • 2
  • 3
  • 4
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/353577
推荐阅读
相关标签
  

闽ICP备14008679号