当前位置:   article > 正文

word2vec模型原理(附python实现代码)_wore2vec模型原理

wore2vec模型原理
 

附python实现代码

模型训练

  1. import logging
  2. import gensim
  3. from gensim.models import word2vec
  4. # 设置输出日志
  5. logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
  6. # 直接用gemsim提供的API去读取txt文件,读取文件的API有LineSentence 和 Text8Corpus, PathLineSentences等。
  7. sentences = word2vec.LineSentence("F:/数据集/微博新闻数据集/result.txt")
  8. # 训练模型,词向量的长度设置为200, 迭代次数为8,采用skip-gram模型,模型保存为bin格式
  9. model = gensim.models.Word2Vec(sentences, size=200, sg=1, iter=8)
  10. model.wv.save_word2vec_format("./word2Vec" + ".bin", binary=True)

打印日志(部分截图),完成迭代

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/357355
推荐阅读
相关标签
  

闽ICP备14008679号