当前位置:   article > 正文

NLP基准测试总结_pytorch nlp benchmark基准测试

pytorch nlp benchmark基准测试

先把GLUE榜单地址挂上 :https://gluebenchmark.com/leaderboard/

1、SQuAD(Stanford Question Answering Dataset)

SQuAD是什么?

SQuAD 是斯坦福大学于2016年推出的数据集,一个阅读理解数据集,给定一篇文章,准备相应问题,需要算法给出问题的答案。此数据集所有文章选自维基百科,数据集的量为当今其他数据集(例如,WikiQA)的几十倍之多。一共有107,785问题,以及配套的 536 篇文章。数据集的贡献者为斯坦福Percy Liang等人,Percy Liang是自然语言处理界的一位全才,在Semantic Parsing, QA, Optimization等多

2、GLUE

通常来说,NLP可以分为自然语言理解(NLU)和自然语言生成(NLG)。在NLU方面,我们拿时下最流行的GLUE(General Language Understanding Evaluation)排行榜举例,其上集合了九项NLU的任务,分别是:

  1. CoLA(The Corpus of Linguistic Acceptability):纽约大学发布的有关语法的数据集,该任务
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/350959
推荐阅读
相关标签
  

闽ICP备14008679号