赞
踩
在自然语言处理(NLP)领域中,使用语言模型预训练方法在多项NLP任务上都获得了不错的提升,广泛受到了各界的关注。在bert之前,将预训练的embedding应用到下游任务的方式大致可以分为2种,一种是feature-based,例如ELMo这种将经过预训练的embedding作为特征引入到下游任务的网络中;一种是fine-tuning,例如GPT这种将下游任务接到预训练模型上,然后一起训练。然而这2种方式都会面临同一个问题,就是无法直接学习到上下文信息,像ELMo只是分别学习上文和下文信息,然后concat起来表示上下文信息,抑或是GPT只能学习上文信息。
随后提出一种基于transformer encoder的预训练模型,可以直接学习到上下文信息,叫做bert。bert使用了12个transformer encoder block,在13G的数据上进行了预训练,可谓是nlp领域大力出奇迹的代表。在整个流程上与transformer encoder没有大的差别,只是在embedding,multi-head attention,loss上有所差别。自此开始,各式各样的预训练自然语言模型层出不穷,并且在各式各样的NLP任务中取得不错的效果。
本资源由Hugging Face整理分享,包含了3000+的已经与训练好的自然语言处理模型库,包含了各式各样的NLP模型。
全部数据获取地址:https://huggingface.co/models?p=0
部分数据截图
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。