该 Github 项目是斯坦福大学 cs-224n 课程中各种深度 NLP 模型的 PyTorch 实现。
项目地址:https://github.com/DSKSD/DeepNLP-models-Pytorch
该实现项目并不是面向 PyTorch 初学者,如果你还未用过 PyTorch,建议以下教程:
- https://github.com/DSKSD/DeepNLP-models-Pytorch#references
如果你对 DeepNLP 感兴趣,建议观看 cs223n 的课件与视频:
- PPT:http://web.stanford.edu/class/cs224n/syllabus.html
- 视频:https://www.youtube.com/watch?v=OQQ-W_63UgQ&list=PL3FW7Lu3i5Jsnh1rnUwq_TcylNr7EkRe6
包含内容
需求
- Python 3.5
- Pytorch 0.2
- nltk 3.2.2
- gensim 2.2.0
- sklearn_crfsuite
开始
git clone https://github.com/DSKSD/cs-224n-Pytorch.git
准备数据集
- cd script
- chmod u+x prepare_dataset.sh
- ./prepare_dataset.sh
docker env
ubuntu 16.04 python 3.5.2 加上 tensorflow, sklearn, pytorch 等各种深度学习/机器学习程序包:
docker pull dsksd/deepstudy:0.2
- pip3 install docker-compose
- cd script
- docker-compose up -d