当前位置:   article > 正文

gensim中doc2vec调参_doc2vec 分词参数优化

doc2vec 分词参数优化

在文本分类中,需要把文本转换成向量。官方文档

https://radimrehurek.com/gensim/models/doc2vec.html
  • 1

doc2vec算法是基于word2vec算法。

model = Doc2Vec(documents, size=100, window=8, min_count=5, workers=4)
  • 1

documents是训练文档,训练文档必须是一行一个文本,并且进行过分词。

file = open(u'/home/ubuntu/file/数据平衡无分类', encoding='utf-8')
documents = gensim.models.doc2vec.TaggedLineDocument(file)
  • 1
  • 2

参数有三个s

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/344166
推荐阅读
相关标签
  

闽ICP备14008679号