NLP基准测试总结_pytorch nlp benchmark基准测试

作者：Cpp五条 | 2024-04-02 05:07:53

踩

pytorch nlp benchmark基准测试

先把GLUE榜单地址挂上：https://gluebenchmark.com/leaderboard/

1、SQuAD（Stanford Question Answering Dataset）

SQuAD是什么？

SQuAD 是斯坦福大学于2016年推出的数据集，一个阅读理解数据集，给定一篇文章，准备相应问题，需要算法给出问题的答案。此数据集所有文章选自维基百科，数据集的量为当今其他数据集(例如，WikiQA)的几十倍之多。一共有107,785问题，以及配套的 536 篇文章。数据集的贡献者为斯坦福Percy Liang等人，Percy Liang是自然语言处理界的一位全才，在Semantic Parsing, QA, Optimization等多

2、GLUE

通常来说，NLP可以分为自然语言理解（NLU）和自然语言生成（NLG）。在NLU方面，我们拿时下最流行的GLUE(General Language Understanding Evaluation)排行榜举例，其上集合了九项NLU的任务，分别是：

CoLA(The Corpus of Linguistic Acceptability):纽约大学发布的有关语法的数据集，该任务

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Cpp五条/article/detail/350959?site