当前位置:   article > 正文

sentence-transformers_sentencetransformer下载的模型位置

sentencetransformer下载的模型位置

使用场景

中文英文混合文本,近似度比较

使用方式

        pip安装

pip install sentence-transformers


        导入包

  1. import sys
  2. from sentence_transformers.util import cos_sim  
  3. from sentence_transformers import SentenceTransformer as SBert

使用模型

        下载

模型网站链接为:https://public.ukp.informatik.tu-darmstadt.de/reimers/sentence-transformers/v0.2/

然后查找paraphrase-multilingual-MiniLM-L12-v2这个模型名字,点击下载即可

        导入

model = SBert("C:\\Users\xxxx\Downloads\\paraphrase-multilingual-MiniLM-L12-v2")

        计算相似度

  1. sentences1 ="xxxxx1"
  2. sentences2 = "xxxxxx2"
  3. # Compute embedding for both lists
  4. embeddings1 = model.encode(sentences1)
  5. embeddings2 = model.encode(sentences2)
  6. # Compute cosine-similarits
  7. cosine_scores = cos_sim(embeddings1, embeddings2)
  8. cosine_scores

限制

sentence有512token限制

参考:https://blog.csdn.net/yuanzhoulvpi/article/details/121755062

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/522129
推荐阅读
  

闽ICP备14008679号