赞
踩
Word2Vec是一种将文本中的词转换成数字向量的技术。它通过在大型文本语料库上训练来学习每个词与其他词的关系,并将这些词映射到数字向量空间中。
下面是使用 Python 实现 Word2Vec 的示例代码(需要安装 gensim 库):
import gensim# 加载语料库,这里使用了一个预处理过的新闻数据集sentences = gensim.models.word2vec.LineSentence('news.txt') # 训练模型,设置词向量维度为 100model = gensim.models.Word2Vec(sentences, size