赞
踩
0-前序
Bert已经是相当6了,但在STS(语义文本相似性)任务中,需要将两个句子都输入到网络中,也就是说要过模型,这样计算量就大了。如下是文本相似性,并不是语义。
- from transformers import BertTokenizer, BertModel
- tokenizer = BertTokenizer.from_pretrained('bert-base-chinese')
- model = BertModel.from_pretrained('bert-base-chinese')
- inputs1 = tokenizer('今天的天气真好啊,暖和和的', return_tensors='pt')
- inputs2 = tokenizer('今天天气真暖和啊', return_tensors='pt')
- inputs3= tokenizer('今天天气真差劲啊', return_tensors='pt')
- outputs1 = model(**inputs1)
- outputs2 = model(**inputs2)
- outputs3 = model(**inputs3)
- outputs1 =outputs1.pooler_output
- outputs2 =outputs2.pooler_output
- outputs3 =outputs3.pooler_output
- import torch
- from sklearn.metrics.pairwise import cosine_similarity
- torch.n
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。