赞
踩
在使用Word2vec 进行模型保存的时候,有两种保存方法:
你好
, 将这个模型保存后,加载后新的预料里也有你好
,那么下面的形式将会更新你好
的Embeddingfrom gensim.models import Word2Vec
# 假设已经有了一个模型叫 model
model.wv.save(file_path)
对应的加载方法:
model = Word2Vec.load(file_path)
# 接下来整理一些自己的语料
corpus = [['你好', '我爱', 'python'], ['编程', '很美']]
model.build_vocab(corpus, update=True)
model.train(corpus, total_examples=model.corpus_count, epochs=model.iter)
model.wv.save_word2vec_format(file_path)
加载模式如下:
from gensim.models import Word2Vec from gensim.models import KeyedVectors model = Word2Vec(size=300, sg=1, min_count=1) # 这里设置的维数必须和预训练的模型一致才行 # 加载预训练的模型 pre_model = KeyedVectors.load_word2vec_format(model_path, binary=False) # 训练新的模型 model.build_vocab([list(pre_model.vocab.keys())], update=True) # 加载预训练模型 model.intersect_word2vec_format(model_path, binary=False, lockf=1.0) model.train(corpus=新的预料, total_examples=model.corpus_count, epochs=model.epochs)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。