赞
踩
本篇主要介绍如何通过中文维基百科语料库来训练一个word2vec模型。
中文维基百科下载地址:https://dumps.wikimedia.org/zhwiki/
我下载是zhwiki-latest-pages-articles.xml.bz2 文件
文件名 | 内容 |
zhwiki-latest-pages-articles.xml.bz2 | 词条正文 |
zhwiki-latest-redirect.sql.gz | 词条重定向(同义词) |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。