当前位置:   article > 正文

中英文互译赫尔辛基大学翻译模型安装与测试_opus-mt-en-zh无法下载

opus-mt-en-zh无法下载

引子

        近期接到一个文本中英互译的任务,一直以为这种翻译应该很成熟,各种商用版本很多。那么开源的一定也不少,经过网络搜索发现,近两年还真的出现了很多优秀的开源翻译项目。找到了赫尔辛基大学开源免费的多语言翻译模型,开发了1400多个多语种翻译模型。其中就包含了中译英和英译中。OK,那就让我们开始吧。

一、环境安装

1、模型下载

下载地址:英译中 https://huggingface.co/Helsinki-NLP/opus-mt-en-zh/tree/main

                  中译英 https://huggingface.co/Helsinki-NLP/opus-mt-zh-en/tree/main

        下载红框中的7个文件即可,下载完成后,文件放入指定两个不同文件夹中

2、anaconda环境

conda create -n translation python==3.10

conda activate translation

pip install transformers[sentencepiece] -i Simple Index

pip install torch -i Simple Index

pip install sacremoses

二、测试

1、中译英 python zh_en_test.py

  1. from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
  2. from transformers import pipeline
  3. model_path = './zh-en/'
  4. #创建tokenizer
  5. tokenizer = AutoTokenizer.from_pretrained(model_path)
  6. #创建模型
  7. model = AutoModelForSeq2SeqLM.from_pretrained(model_path)
  8. #创建pipeline
  9. pipeline = pipeline("translation", model=model, tokenizer=tokenizer)
  10. chinese="""
  11. 中国男子篮球职业联赛(Chinese Basketball Association),简称中职篮(CBA),是由中国篮球协会所主办的跨年度主客场制篮球联赛,中国最高等级的篮球联赛,其中诞生了如姚明、王治郅、易建联、朱芳雨等球星。"""
  12. result = pipeline(chinese)
  13. print(result[0]['translation_text'])

2、英译中 python en_zh_test.py

  1. from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
  2. from transformers import pipeline
  3. model_path = './en-zh/'
  4. #创建tokenizer
  5. tokenizer = AutoTokenizer.from_pretrained(model_path)
  6. #创建模型
  7. model = AutoModelForSeq2SeqLM.from_pretrained(model_path)
  8. #创建pipeline
  9. pipeline = pipeline("translation", model=model, tokenizer=tokenizer)
  10. english="""
  11. The official site of the National Basketball Association. Follow the action on NBA scores, schedules, stats, news, Team and Player news.
  12. """
  13. result = pipeline(english)
  14. print(result[0]['translation_text'])

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/599824
推荐阅读
相关标签
  

闽ICP备14008679号