当前位置:   article > 正文

Hugging Face 3000+NLP预训练模型库整理分享_hugfacing的模型资源

hugfacing的模型资源

图片

    在自然语言处理(NLP)领域中,使用语言模型预训练方法在多项NLP任务上都获得了不错的提升,广泛受到了各界的关注。在bert之前,将预训练的embedding应用到下游任务的方式大致可以分为2种,一种是feature-based,例如ELMo这种将经过预训练的embedding作为特征引入到下游任务的网络中;一种是fine-tuning,例如GPT这种将下游任务接到预训练模型上,然后一起训练。然而这2种方式都会面临同一个问题,就是无法直接学习到上下文信息,像ELMo只是分别学习上文和下文信息,然后concat起来表示上下文信息,抑或是GPT只能学习上文信息。

    随后提出一种基于transformer encoder的预训练模型,可以直接学习到上下文信息,叫做bert。bert使用了12个transformer encoder block,在13G的数据上进行了预训练,可谓是nlp领域大力出奇迹的代表。在整个流程上与transformer encoder没有大的差别,只是在embedding,multi-head attention,loss上有所差别。自此开始,各式各样的预训练自然语言模型层出不穷,并且在各式各样的NLP任务中取得不错的效果。

     

    本资源由Hugging Face整理分享,包含了3000+的已经与训练好的自然语言处理模型库,包含了各式各样的NLP模型。

 

    全部数据获取地址:https://huggingface.co/models?p=0

     

部分数据截图

图片

图片

图片

图片

图片

图片

图片

图片

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/662455
推荐阅读
相关标签
  

闽ICP备14008679号