赞
踩
在文本分类中,需要把文本转换成向量。官方文档
https://radimrehurek.com/gensim/models/doc2vec.html
doc2vec算法是基于word2vec算法。
model = Doc2Vec(documents, size=100, window=8, min_count=5, workers=4)
documents是训练文档,训练文档必须是一行一个文本,并且进行过分词。
file = open(u'/home/ubuntu/file/数据平衡无分类', encoding='utf-8')
documents = gensim.models.doc2vec.TaggedLineDocument(file)
参数有三个s
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。