赞
踩
在 Python 中,可以使用现有的自然语言处理库,如 jieba、gensim 或者 thulac 等来将中文句子向量化。
使用 jieba 库,先对句子进行分词,再使用 word2vec 模型将分词后的词语转换为向量。
使用 gensim 库,可以直接训练 word2vec 模型,再将句子转换为向量。
使用 thulac 库,对中文句子进行分词,再使用 word2vec 模型将分词后的词语转换为向量。
另外,还有很多第三方库可以实现中文句子向量化,如 BERT、ERNIE、RoBERTa 等等。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。