赞
踩
huggingface是一个开源社区,它提供了先进的NLP模型,数据集、以及其它便利工具。
huggingface提供的模型非常多,但主要的模型为:
自回归: GPT2 Trasnformer-XL XLNet
自编码: BERT ALBERT RoBERTa ELECTRA
SeqtoSeq: BART Pegasus T5
----------------------------------------------------------------------------------------------------------
自回归模型:预测下一个词,因为使用x获取y叫做回归,所有x预测下一个x称为自回归
自编码模型:还原出本身,根据上下为还原出本身的词
Seq2Seq: 从一个文本序列到另一个序列,比如机器翻译
迁移学习举例:你已经认识了很多张图片,这时候你将100章图片放入预训练模型时,它会抽取特征,此时你再下游定义一个模型,只需要提供100照片和是不是猫两个集合,就可以训练出一个辨别是否为猫的模型(也可以为多分类)–只需要训练下游模型参数,而不需要训练预训练模型(REQUIRES_GRAD = False)
视频地址:https://www.bilibili.com/video/BV1a44y1H7Jc/?spm_id_from=333.337.search-card.all.click&vd_source=a66e728886f37b4b360358ac380f6885
github地址:https://github.com/lansinuote/Huggingface_Toturials/
1.install.ipynb 安装
2.tokenizer.ipynb 字典和分词根据
3.datasets.ipynb 数据集操作
4.metrics.ipynb 评价函数的使用
5.pipeline.ipynb 管道方法的使用
7.中文分类.ipynb 实战任务1(重点)
8.中文填空.ipynb 实战任务2(重点)
9.中文句子关系推断.ipynb 实战任务3(重点)
10.trainer.ipynb
11.中文分类_CUDA.ipynb
1-5是对huggingface提供的工具集分门别类的简单快速讲解
huggubface网址:https://huggingface.co
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。