赞
踩
在Models - Hugging Face模型中找使用方法
对于文字处理AutoTokenizer是一样的,模型名可能不一样。具体操作如下:
滑到底端的如何使用,此为pytorch的使用方法,也有其他的说明。
其中字符串名字可以为路径。
分词器命名:"模型名+Tokenizer"
图片处理命名:模型名+ImageProcessor
模型名命名:“ 模型名+Modal”
这个命名和公司有关,还是直接选择自己需要的模型在官网查询使用最好。
- # -------------------- 使用 RobertaTokenizer ---------------
- tokenizer = RobertaTokenizer.from_pretrained(pretrained_model_path)
- inputs = tokenizer("对比原始的分词和最新的分词器", return_tensors="pt")
- print(inputs['input_ids'])
-
-
- # -------------------- 使用 AutoTokenizer ---------------
- auto_tokenizer = AutoTokenizer.from_pretrained(pretrained_model_path) # 使用一样的
- auto_inputs = auto_tokenizer('对比原始的分词和最新的分词器', return_tensors='pt')
- print(auto_inputs['input_ids'])
输出的结果一样。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。