当前位置:   article > 正文

python安装bert模型_Pytorch中使用Bert预训练模型,并给定句子得到对应的向量

安装 pytorch_pretrained_bert库

写在前面

本次的需求是:通过预训练好的Bert模型,得到不同语境下,不同句子的句向量。相比于word2vec、glove这种静态词向量,会含有更丰富的语义,并能解决不同场景不同意思的问题。

建议大家先看Bert原论文(看之前最好懂得ELMo,一定要懂transformer),再结合这个博客(墙裂推荐)

开始

本次记录一共分成以下四步:

安装transformer包

导入BertTokenizer和BertModel

将要输入的句子修改为Bert要求的输入形式

输入Bert模型,得到token向量

安装transformer包

pip install transformer

导入BertTokenizer和BertModel

首先,去huggingface下载你要的预训练模型,我选择的是bert-base-chinesem。需要下载的文件包括:模型bin文件、vocab.txt和config.json。

其次,利用以下代码即可导入BertTokenizer和BertModel。

from transformers import BertModel, BertTokenizer, BertConfig

tokenizer = BertTokenizer.from_pretrained('./model/dl_model/bert')

model = BertModel.from_pretrained('./model/dl_model/bert',)

注意,传入的参数是包含模型所有文件的目录名。其中vocab文件的文件名必须是vocab.txt文件名࿰

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/235704?site
推荐阅读
相关标签
  

闽ICP备14008679号