当前位置:   article > 正文

使用中文维基百科语料库训练一个word2vec模型并使用说明_训练好的word2vec中文模型

训练好的word2vec中文模型

本篇主要介绍如何通过中文维基百科语料库来训练一个word2vec模型。

一、语料库的下载

中文维基百科下载地址:https://dumps.wikimedia.org/zhwiki/

我下载是zhwiki-latest-pages-articles.xml.bz2 文件

文件名 内容
zhwiki-latest-pages-articles.xml.bz2  词条正文
zhwiki-latest-redirect.sql.gz   词条重定向(同义词)
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/607264
推荐阅读
相关标签
  

闽ICP备14008679号